云計(jì)算到來 數(shù)據(jù)中心維護(hù)需要重點(diǎn)關(guān)注什么
掃描二維碼
隨時(shí)隨地手機(jī)看文章
進(jìn)入7月,運(yùn)維人期待的7·24日運(yùn)維日馬上就要到了,每年到這個(gè)時(shí)候,我們就開始重新審視數(shù)據(jù)中心運(yùn)維的問題與難點(diǎn)。隨著云計(jì)算逐步落地和深入應(yīng)用,云數(shù)據(jù)中心運(yùn)維這個(gè)在10年前就已經(jīng)在討論的問題仍然熱度不退。
關(guān)注智能自動化運(yùn)維的趨勢與難點(diǎn)
智能自動化運(yùn)維是云數(shù)據(jù)中心時(shí)代尤為重要的趨勢。公有云讓基礎(chǔ)設(shè)施資源更集中,企業(yè)放棄自建數(shù)據(jù)中心轉(zhuǎn)而使用公有云,基礎(chǔ)設(shè)施資源因此集中到了第三方服務(wù)商的手中。
這一定程度上使得企業(yè)運(yùn)維輕量化,更注重上層應(yīng)用的運(yùn)維,后端較重的基礎(chǔ)設(shè)施運(yùn)維轉(zhuǎn)嫁集中到了第三方公有云服務(wù)商的身上?;A(chǔ)設(shè)施運(yùn)維的集中化,大體量化為自動化運(yùn)維提供了良好的生存空間,企業(yè)前端的輕量的運(yùn)維甚至也可以通過大數(shù)據(jù)以智能可視化的方式呈現(xiàn)出來。
多平臺融合的導(dǎo)致故障點(diǎn)監(jiān)測困難
有業(yè)界人士稱,相對于傳統(tǒng)IT架構(gòu),云數(shù)據(jù)中心運(yùn)維的管理對象主要分為五大類,分別是:
機(jī)房環(huán)境基礎(chǔ)設(shè)施部分,包含風(fēng)火水電等;各種設(shè)備,包括存儲、服務(wù)器、網(wǎng)絡(luò)設(shè)備、安全設(shè)備等硬件資源;系統(tǒng)與數(shù)據(jù),包括操作系統(tǒng)、數(shù)據(jù)庫、中間件、應(yīng)用程序等軟件資源及業(yè)務(wù)數(shù)據(jù);管理工具,包括了基礎(chǔ)設(shè)施監(jiān)控軟件、監(jiān)控軟件、工作流管理平臺、報(bào)表平臺、短信平臺等
從中可以看出,一項(xiàng)云數(shù)據(jù)中心向外界提供服務(wù)是多方服務(wù)融合的結(jié)果。因此,當(dāng)面臨一個(gè)故障時(shí),如何在諸多服務(wù)中準(zhǔn)確追溯到故障點(diǎn),是運(yùn)維人員需要關(guān)注的另一個(gè)問題。
避免人為失誤與網(wǎng)絡(luò)威脅
前不久,中國某大型云廠商因運(yùn)維人員操作失誤啟動了一個(gè)BUG,導(dǎo)致一些客戶訪問官網(wǎng)控制臺和使用MQ、NAS等多項(xiàng)產(chǎn)品功能出現(xiàn)問題,造成了較大影響.實(shí)際上,除了自然災(zāi)害等原因,數(shù)據(jù)中心運(yùn)維出現(xiàn)的一些安全問題極有可能是人為導(dǎo)致的。
出了要避免人為上的失誤,來自網(wǎng)絡(luò)的威脅也不可小覷。數(shù)據(jù)中心資源的集中化讓我們逐漸感受到,數(shù)據(jù)中心故障的大型化趨勢越來越明顯,從網(wǎng)絡(luò)安全的角度來說一個(gè)漏洞被利用,就可能會造成較大的數(shù)據(jù)丟失甚至設(shè)備停機(jī)事故。