谷歌云周日宕機(jī)原因公布:原因系服務(wù)器配置變更
IT之家6月4日消息 昨日,谷歌云出現(xiàn)宕機(jī)問題,影響了谷歌內(nèi)部和外部的多項服務(wù),導(dǎo)致美國東部地區(qū)網(wǎng)絡(luò)擁堵,涉及谷歌云、谷歌智能應(yīng)用套件G Suite和YouTube等多項服務(wù),對大量用戶造成影響。
谷歌隨后表示,所有因網(wǎng)絡(luò)擁堵受影響用戶的問題已經(jīng)解決。谷歌將對故障原因展開調(diào)查,并提供相關(guān)調(diào)查報告。今日,Google官方博客解釋了事故原因。
谷歌指出,從本質(zhì)上講,昨日的網(wǎng)絡(luò)中斷是因為服務(wù)器配置更改。適用于單一區(qū)域中的少數(shù)服務(wù)器,錯誤地應(yīng)用于多個相鄰區(qū)域的大量服務(wù)器,進(jìn)而導(dǎo)致這些區(qū)域停止使用一半以上的可用網(wǎng)絡(luò)容量。進(jìn)出這些區(qū)域的網(wǎng)絡(luò)流量試圖適應(yīng)剩余的網(wǎng)絡(luò)容量,導(dǎo)致了網(wǎng)絡(luò)擁堵。網(wǎng)絡(luò)系統(tǒng)成功 分流了過載流量,保留了對延遲敏感的流量,并丟棄了大部分對延遲不是很敏感的流量。
谷歌表示,谷歌的工程團(tuán)隊在幾秒鐘內(nèi)就發(fā)現(xiàn)了這個問題,但診斷和糾正的時間遠(yuǎn)遠(yuǎn)超過預(yù)期。收到警報后,谷歌工程團(tuán)隊就迅速確定了故障原因,但網(wǎng)絡(luò)擁堵同樣降低了工程團(tuán)隊恢復(fù)正確配置的能力,從而延長了停機(jī)時間。
事故期間,YouTube全球觀看次數(shù)下降了10%,Google云存儲的流量減少了30%,大約1%的Gmail活躍用戶帳戶出現(xiàn)了問題。