[]最初,公共云是建立在通用硬件上以降低成本并大規(guī)模運行的,但現(xiàn)在情況正在改變。
向高度可擴展的AI和機器學習工作負載以及IoT和分析應用程序的轉(zhuǎn)變正推動云供應商考慮采用新架構(gòu)。傳統(tǒng)的芯片和硬件制造商正在嘗試將這些功能推向市場。但是,主要的云供應商越來越多地將事情交到自己手中,因為這些制造商無法滿足他們的需求。
在云硬件方面,亞馬遜已經(jīng)擁有一家小型芯片制造商,而谷歌擁有其張量處理單元(TPU)。云巨頭之間的競爭有望改變基礎架構(gòu)的構(gòu)建方式以及開發(fā)人員如何使用基礎架構(gòu)。
“最終用戶(將)從這些專門構(gòu)建的計算環(huán)境中受益,并且可以更加高效地工作,因為平臺將在那里支持他們需要實現(xiàn)的目標,”數(shù)字轉(zhuǎn)型咨詢公司Brillio負責云轉(zhuǎn)換服務的副總裁Fahim Khan這樣說。
亞馬遜在其云硬件定制方面一直是最積極的。它始于構(gòu)建更高效的路由器。然后,它開始使用Nitro System重新考慮其服務器體系結(jié)構(gòu),從而為虛擬機配置的各個方面帶來了效率。最近,亞馬遜開發(fā)了AWS Inferentia(一種用于AI的客戶推理引擎)以及基于ARM架構(gòu)的Graviton系列CPU。
云供應商正在從第三方探索云硬件架構(gòu),這些架構(gòu)旨在加速AI工作負載,降低成本或兩者兼而有之。數(shù)十家AI芯片和量子計算初創(chuàng)公司也涌現(xiàn)出來,其產(chǎn)品可以在云中使用。這些初創(chuàng)公司也在開發(fā)用于優(yōu)化云基礎架構(gòu)的新型芯片。
自定義云硬件的關鍵驅(qū)動程序
云提供商已利用對可支持大數(shù)據(jù)量的創(chuàng)新軟件模型和平臺的需求。這是轉(zhuǎn)向定制云硬件和基于硬件的功能的主要推動力。
云管理平臺CloudCheckr的首席技術(shù)官杰夫·瓦倫丁說:“對以更低的成本提高計算能力的需求也越來越高,這不僅推動了公共云提供商的硬件創(chuàng)新,還推動了新的軟件服務。”
隨著云使用量的增長,公共云提供商只能以兩種方式之一有效運行。他們要么將商品硬件插入數(shù)據(jù)中心以嘗試滿足其獨特需求,要么在內(nèi)部進行設計和開發(fā)。 Valentine說,公共云供應商正在使用定制硬件來改善可用性,性能,安全性和成本。而更安全可靠的基礎架構(gòu)最終將吸引并留住更多客戶。
在云計算的早期,提供商遇到的第一個問題是密度和散熱。數(shù)據(jù)中心空間非常昂貴,而散熱是一個大問題。供應商將主板安裝在機架上,并在機架上運行專業(yè)風扇以適當冷卻所有組件。
瓦倫丁說:“自那時以來,我們?nèi)〉昧撕艽筮M步,但是公共云提供商一直沒有停止努力,竭盡所能?!?/p>
今天的焦點主要集中在如何操作基礎架構(gòu)上。如果Microsoft,Amazon或任何其他云提供商可以使其基礎架構(gòu)超高效,則理論上可以通過較低的價格將節(jié)省下來的費用轉(zhuǎn)嫁給客戶。
但是云數(shù)據(jù)中心的運行方式與典型的企業(yè)設施大不相同,這給供應商帶來了獨特的挑戰(zhàn)。例如,商品硬件可以通過軟件更新固件,但是必須對共享服務器進行專門配置以禁止這樣做。相反,這些供應商必須在可以安全地將其配置到硬件BIOS時推出更新。 Valentine說,這對公共云人員來說是一個痛苦。
結(jié)果,AWS開發(fā)了Nitro安全芯片,因此可以由AWS以及僅AWS更新固件。這節(jié)省了AWS的時間和精力,但是這些類型的幕后工作在很大程度上(至少是直接)不會被客戶注意到。
Valentine說:“現(xiàn)實是,大多數(shù)客戶只會注意到成本?!?/p>
定制硬件的未來好處
在大多數(shù)云計算模型中,最終用戶不會直接接觸硬件。最終用戶減少的開銷是云如此流行的主要原因之一。
高級副總裁Jeff Wittich表示:“這種[摘要]可以跟上需求的步伐,以更高的成本提供更好的服務質(zhì)量,提供針對工作負載選擇正確類型的硬件的能力,而不會給最終用戶帶來任何額外的復雜性?!卑雽w公司Ampere的產(chǎn)品總裁,該公司為云和邊緣基礎架構(gòu)創(chuàng)建CPU。
云提供商一直在尋找能夠提高產(chǎn)品質(zhì)量的數(shù)據(jù)中心效率。一個引起更多關注的領域涉及減少延遲。Pensando Systems的CTO Vipin Jain說,這在COVID-19以及家庭,在線游戲,遠程學習和視頻會議工作量增加之后尤其重要,該公司將定制芯片用于其軟件定義的服務平臺。 Jain表示,定制硬件有望幫助緩解性能過高的基礎架構(gòu)所面臨的壓力,而對于規(guī)模如此之大的快速增長,基礎架構(gòu)從來就沒有達到過合適的規(guī)模。
裸機是數(shù)字基礎架構(gòu)的新興類別,它使企業(yè)能夠?qū)⒐ぷ髫撦d部署在安全的單租戶硬件上,并按地理位置分布以提高鄰近性和性能。傳統(tǒng)上,需要單租戶硬件的組織必須購買主機托管和電源,訂購和運送自己的硬件,然后雇用技術(shù)人員來設置,測試和激活服務器。基于云的裸機使客戶可以在需要滿足一系列標準服務器配置要求時跳過這些步驟并按需創(chuàng)建計算實例。
AWS Nitro系統(tǒng)的一個副作用是,它使配置裸機實例變得更加容易,這使組織能夠自定義其在AWS中運行的基礎架構(gòu)。
在未來,云提供商可能會使用自定義硬件來重新構(gòu)想諸如AI之類的傳統(tǒng)計算架構(gòu)。例如,IBM研究人員一直在研究新型的神經(jīng)形態(tài)芯片,它們可以在內(nèi)存中執(zhí)行計算。
IBM Research神經(jīng)形態(tài)與內(nèi)存計算小組的研究人員Manuel Le Gallo說,這實際上消除了執(zhí)行多種類型的AI計算時的內(nèi)存處理器瓶頸。
但是,這種技術(shù)的類型還需要幾年的時間,并且將要求開發(fā)人員學習新的編程技術(shù)。同時,諸如亞馬遜的Nitro System之類的想法將啟發(fā)其他方法來重新思考傳統(tǒng)的云架構(gòu)。
但是,提高效率可能會不利。下一波云硬件創(chuàng)新可能會創(chuàng)建一種新型的鎖定方式,這具有諷刺意味,因為云開始時幾乎完全依賴商品基礎架構(gòu)組件。
從理論上講,自定義硬件(例如Amazon的Graviton CPU或Google TPU)應與其他硬件運行相同的軟件。但是,企業(yè)可能會傾向于采用特定于云的輔助服務來提高性能或減少其應用程序的維護。這可能會導致更難遷移到其他云平臺。[]