上周末,T-Mobile公司宣布了一個讓數(shù)十萬Sidekick手機用戶心碎的消息,由于微軟/Danger方面的服務器問題,存儲在這些服務器上的眾多用戶數(shù)據(jù)“幾乎肯定已經(jīng)全部丟失”。
此次事件堪稱史上最大規(guī)模的云計算事故,預計在一切塵埃落定后,美國政府、微軟、T-Mobile都將進行詳盡調查,大量用戶肯定會就此事進行投訴,甚至聯(lián)合狀告涉案各方賠償損失。那么,造成如此嚴重事故的原因究竟是什么呢?這個周末炒得最火熱的傳言是,一切都源于微軟將Sidekick服務器的升級工作外包。
去年微軟收購Danger公司后,不少原Danger員工離職另謀生路,再加上微軟主動裁撤了大量Danger與微軟重疊的業(yè)務崗位,導致原Danger公司中的Sidekick服務支持員工數(shù)量不足。于是,在近期Sidekick數(shù)據(jù)中心SAN(存儲域網(wǎng)絡,即所有用戶數(shù)據(jù)的存儲地)需要進行升級時,微軟將整個升級工作外包給了日立公司進行。
不知是由于數(shù)據(jù)量過大,時間過于緊迫,還是其他什么原因,總之日立在進行此次升級前,居然沒有對原數(shù)據(jù)進行備份。隨后災難就真的來了,SAN升級過程中遇到了嚴重問題,導致用戶數(shù)據(jù)幾乎全部丟失無法恢復。目前他們能做的補救措施是,讓新服務器盡快上線,然后通過用戶手機與服務器同步,將手機上的數(shù)據(jù)回傳上來。這也就是T-Mobile要求用戶在恢復正常前不要關閉手機的原因。