可以肯定的是,AIOps已經(jīng)成為當今流行的術(shù)語之一。嚴格來說,它是指使用人工智能來協(xié)助IT運營。從另一個意義上來說,它讓人聯(lián)想到利用人工智能將企業(yè)的技術(shù)基礎設施提升到一個全新的水平。在一次網(wǎng)絡研討會中,行業(yè)專家討論了以下主題:
什么是AIOps? 如何開始使用AIOps? 面臨的挑戰(zhàn)是什么?如何解決這些問題? AIOps的未來是什么?未來2~3年將何去何從,而企業(yè)現(xiàn)在如何準備?
BMC Software公司首席產(chǎn)品官Ali Siddiqui和Intellyx公司總裁Jason Bloomberg這兩位AIOps行業(yè)專家對這些主題進行了分析和探討。
什么是AIOps?
Siddiquiu:“我認為AIOps的字面意思是‘用于運營的人工智能’。人工智能實際上是計算機科學的一個分支,專注于機器模式識別和統(tǒng)計技術(shù)來分析其環(huán)境,因此在AIOps的案例中,它將分析IT運營環(huán)境。而且我要說的是,要不斷提供場景信息,AIOps將能夠在事情發(fā)生之前看到它們。而這確實是一項關鍵技術(shù),確實推動了ITOps的數(shù)字化轉(zhuǎn)型?!?/p>
Bloomberg:“實際上,無論這個術(shù)語是好是壞,它都是Gartner公司提出的一個術(shù)語。它最初是指用于運營的算法基礎設施,而沒有人知道它們的含義,并且根本沒有任何意義。
但是它并沒有流行起來,所以他們很快就改變了其說法,并說:‘每個人都認為AIOps意味著人工智能,所以這就是我們一直以來認為的真正含義,并且是用于運營的人工智能’。但是正因如此,這確實是Gartner公司所做出的努力。該公司還創(chuàng)建IT運營管理(ITOM)這個術(shù)語,并將其與人工智能技術(shù)以某種方式組合在一起,然后觀察供應商對此怎么做?!?/p>
那么AIOps主要用于IT嗎?還是AIOps可以幫助企業(yè)運營業(yè)務的更大事情?
Bloomberg:“我想說的是這可能是一個間接的情況,因為當今的現(xiàn)代數(shù)字企業(yè)是軟件授權(quán)的。因此,對于開展數(shù)字化轉(zhuǎn)型的組織來說,軟件可以幫助他們與客戶建立聯(lián)系。確保軟件能夠正常運行,并且功能強大并且能夠滿足業(yè)務需求是當前業(yè)務優(yōu)先事項的核心部分,因此業(yè)務現(xiàn)在與IT一樣令人關注,所以從這個意義上來說,AIOps將為此提供支持數(shù)字企業(yè)的愿景,但實際上仍與IT運營有關?!?/p>
如果企業(yè)希望加入AIOps,那么首先要做的是什么?
Siddiqui:“因此,在IT組織中,需要選擇其中一些用例,最好是一兩個用例,然后將企業(yè)的團隊吸引到合適的供應商那里,以解決這些特定用例,并確實有一些主要目標告訴企業(yè)是否成功。所以這是我想說的關鍵事情之一,不僅僅是評估,還要知道能夠在哪里結(jié)束?成功的標準是什么?”
有什么實際的例子可以證明這一點呢?
Siddiqui:“因此,從ITOps的角度來看,異常檢測將是用例之一。從用例的角度來看,真正含義是不想人工設置閾值或進行基準確定,這是工作人員想通過系統(tǒng)學習來減少噪音,需要自學和自我糾正然后解決問題的東西。通過系統(tǒng)學習并進行異常檢測,然后不僅告訴出現(xiàn)的異常,還要告訴將如何解決問題?!?/p>
Bloomberg:“重要的是要了解,在企業(yè)運營環(huán)境中,已經(jīng)有許多不同的工具,其中一些是較舊的工具,其中一些可能是較新的工具。其中一部分挑戰(zhàn)在于我們擁有這些不同的工具?!?/p>
需要記住,從首席信息官的角度來看,他們不僅擁有很多工具,而且已經(jīng)在很多工具上花費更多費用,因此引進新工具必須有真正的成本理由。所以實際上有兩種方法,一種是需要淘汰一個或多個老舊工具,因為它們不再滿足業(yè)務需要,或者不再支持它。
另外,填補空白可能是將AIOps引入組織的最常見方法,而經(jīng)常出現(xiàn)的問題是事件過多的問題。較舊的AIOps技術(shù)將始終產(chǎn)生事件,這些事件可能代表真正的問題,或者僅代表一些小問題,或者可能是關于同一問題的多個通知,然后企業(yè)最終遇到了這樣的情況,即運營人員每小時看到數(shù)十個問題,而每天的事件數(shù)將會激增。
AIOps特別擅長解決該問題,識別那些異常,因此需要注意的那些奇異事件。它有助于減少次要事件的影響。AIOps也善于結(jié)合相關事件……一旦有了AIOps,這些事件現(xiàn)在將為企業(yè)帶來額外的好處,以幫助其應對事件風暴。”
部署AIOps有哪些挑戰(zhàn),企業(yè)如何應對這些挑戰(zhàn)?
Siddiqui:“部署AIOps的挑戰(zhàn)是不要忘記平衡。當企業(yè)繼續(xù)進行AIOps之旅時,必須考慮所有三個方面:人員、流程和工具。而且現(xiàn)在供應商中都有一些非常好的工具。但是人員和流程可能是薄弱環(huán)節(jié)。
歸根結(jié)底,這實際上是將企業(yè)的業(yè)務重塑為技術(shù)驅(qū)動型業(yè)務。因此,重點實際上是敏捷性,并以客戶為中心。
我認為,業(yè)務成果必須是最重要的。無論是敏捷性還是客戶體驗,改善客戶體驗,所以這些都至關重要?!?/p>
Bloomberg:“重要的是要理解,一般而言,AIOps和在AIOps場景中使用人工智能與當前在企業(yè)中使用人工智能有關,但又有所不同。人工智能在企業(yè)中用于提取大數(shù)據(jù)集的見解特別有用。對于任何在日常業(yè)務中處理大數(shù)據(jù)集的企業(yè)來說,這可能都是適用的。
因此,這是AIOps供應商介入的地方。他們說,‘我們將提供AIOps技術(shù),而無需指派數(shù)據(jù)科學家來處理AIOps技術(shù)。'企業(yè)可以分配運營人員以及負責運營環(huán)境的其他人員。
故事的另一部分是AIOps故事的安全性部分。AIOps可以檢測到的異常,可能只是某些系統(tǒng)內(nèi)存不足或某種運營異常。但通常這是某種網(wǎng)絡安全異常。這表明正在發(fā)生某種攻擊?!?/p>
AIOps的未來是什么,企業(yè)如何為這一未來做準備?
Siddiqui:“因此,如果展望一下AIOps的未來,我認為在未來幾年中,將會有太多數(shù)據(jù)帶來的影響。因此,企業(yè)需要開箱即用的機器學習功能,可以從大量數(shù)據(jù)中洞悉數(shù)據(jù),無論是日志、事件、指標,都無關緊要,然后另一件事是加強IT運營和開發(fā)人,這種緊密的聯(lián)系將進一步推動一些AIOps的需求。
因此,企業(yè)必須有明確的投資回報率,并且工具整合可能會改善客戶體驗。因此,AIOps不僅有助于提高運營效率,而且有助于實現(xiàn)數(shù)字化轉(zhuǎn)型。
因此,我對未來幾年的發(fā)展很樂觀,那就是自主數(shù)字企業(yè)之旅和ITOps緊密合作以找出業(yè)務成果。也就是說,供應商正在制造易于使用的工具。
我們有很多客戶,他們中的許多人仍然是混合型的,這意味著他們正在向云端轉(zhuǎn)移,旅程還沒有結(jié)束。這就意味著有內(nèi)部部署的要求。即使是我們的BMC AMI AIOps套件,特別是剛剛推出的AMI Operational Insight產(chǎn)品,它確實可以在內(nèi)部部署設施中工作?!?/p>
Bloomberg: “我們現(xiàn)在談論AIOps的唯一原因是因為人工智能是新興技術(shù)。再過幾年的時間,所有運維管理都將具有人工智能能力。如果所有東西都是人工智能授權(quán)的,那么人工智能運營將只是運營管理,而不再認為它是一個獨特的類別。
但是,在企業(yè)基礎設施環(huán)境中發(fā)生這種情況有兩個主要驅(qū)動因素。其中之一是,當我們觀察正在發(fā)生的大范圍變化時,正在轉(zhuǎn)向一種稱之為云原生計算的模型,我們在其中將云計算的最佳實踐用于所有企業(yè)IT,包括混合IT。
此外,該環(huán)境也是非常動態(tài)的。這是容器世界(Kubernetes)帶給傳統(tǒng)虛擬機的功能之一,它是一種非常動態(tài)的企業(yè)基礎設施環(huán)境。當企業(yè)擁有這樣的環(huán)境時 將會生成大量數(shù)據(jù),根本沒有辦法人工管理這種環(huán)境,而必須使其自動化。所有這些趨勢都不會停止,而且AIOps將在未來變得越來越重要,并且將無處不在。”