AI混合加速器平臺(tái)有統(tǒng)一的標(biāo)準(zhǔn)嗎
日前,浪潮服務(wù)器產(chǎn)品部副總經(jīng)理張耀文(Alan Chang)在海外權(quán)威AI媒體EnterpriseAI上發(fā)表署名文章,介紹了加速器平臺(tái)統(tǒng)一硬件標(biāo)準(zhǔn)對(duì)AI計(jì)算的重要意義,同大家分享。
如今只要一打開(kāi)電視,就充斥著宣傳人工智能好處和潛力的廣告。人工智能這個(gè)不久前還難以想象的應(yīng)用正變得司空見(jiàn)慣,未來(lái)更會(huì)跳躍式發(fā)展。但是要真正實(shí)現(xiàn)人工智能,高性能、高可靠和可擴(kuò)展的計(jì)算平臺(tái)必不可少,同時(shí)該平臺(tái)還要擁抱開(kāi)源,從而提高互操作性,并且能夠以更快的速度和更低的成本應(yīng)對(duì)市場(chǎng)需求。
為了提高不同AI加速模塊和系統(tǒng)的互操作性,滿足制造商提升人工智能系統(tǒng)能力的需求,OCP(Open Compute Project)聚集了眾多希望利用開(kāi)放標(biāo)準(zhǔn)推動(dòng)AI計(jì)算發(fā)展的合作伙伴共同努力,OAI(Open Accelerator Infrastructure)就是其最新的一個(gè)項(xiàng)目組。憑借以往開(kāi)放硬件和軟件項(xiàng)目的經(jīng)驗(yàn),項(xiàng)目組吸引了來(lái)自計(jì)算生態(tài)系統(tǒng)各個(gè)領(lǐng)域的參與者,取得的最新成果推動(dòng)了加速器技術(shù)的標(biāo)準(zhǔn)化,為AI計(jì)算平臺(tái)提供了更加規(guī)范、簡(jiǎn)單和可訪問(wèn)的開(kāi)放標(biāo)準(zhǔn)。
在最近與OCP和百度領(lǐng)導(dǎo)人進(jìn)行的圓桌會(huì)議上,我們探討了OAI的發(fā)展和價(jià)值主張,并得出了一些值得關(guān)注的結(jié)論。
現(xiàn)在很多企業(yè)都面臨著諸多挑戰(zhàn),無(wú)論是數(shù)據(jù)中心基礎(chǔ)架構(gòu)、硬件加速還是從設(shè)施到機(jī)架再到節(jié)點(diǎn)的硬件管理。OCP努力為應(yīng)對(duì)這些挑戰(zhàn)創(chuàng)造一個(gè)協(xié)作的環(huán)境,并且找到一種通用的解決方案,實(shí)現(xiàn)規(guī)模經(jīng)濟(jì),從而提高效率,節(jié)約成本。
—— OCP社區(qū)總監(jiān)Archna Haylock
OAI的一個(gè)主要目標(biāo)是簡(jiǎn)化加速器模塊的設(shè)計(jì)。由此產(chǎn)生的標(biāo)準(zhǔn)是一種技術(shù)解決方案,制造企業(yè)可以根據(jù)這一標(biāo)準(zhǔn)設(shè)計(jì)自己的產(chǎn)品,而不必從頭開(kāi)始。和其他開(kāi)源軟件(例如Hadoop、GFS、Linux)一樣,用戶可以免費(fèi)下載代碼,然后繼續(xù)進(jìn)行各自的開(kāi)發(fā)工作。
實(shí)際上,該標(biāo)準(zhǔn)促進(jìn)了不同加速器(例如ASIC、GPU和FPGA)技術(shù)的融合,克服了兼容問(wèn)題,并使這些技術(shù)能夠在統(tǒng)一的硬件標(biāo)準(zhǔn)下運(yùn)行。這樣一來(lái),用戶可以自由更換不同的芯片,制造企業(yè)獲得更多選擇。OAI有如下關(guān)鍵技術(shù)優(yōu)勢(shì)。
全面的兼容性,支持當(dāng)前的AI加速器(例如FPGA、GPU和ASIC),以及下一代異構(gòu)加速器;
支持12V和54V電源。12V電源的最大功率為300W,54V電源的最大功率為450W-500W;
支持四種互連拓?fù)?,包括HCM(用于8端口和6端口OAM)、FC、FC/HCM組合和4D Hypercube。
第一批從該規(guī)范受益的產(chǎn)品是百度X-MAN 4.0,這一AI計(jì)算平臺(tái)由百度與浪潮基于OAI標(biāo)準(zhǔn)聯(lián)合開(kāi)發(fā)完成。OAI標(biāo)準(zhǔn)的發(fā)展始于百度、Facebook、微軟三家共同發(fā)起的OpenAPI模型規(guī)范。從這之后,人們意識(shí)到建立AI加速器模塊統(tǒng)一規(guī)范的重要性,于是在OCP社區(qū),重點(diǎn)關(guān)注如何為多樣化的加速器提供最好的支持的OAI研究組成立了。OAI的成立不僅讓制造商在開(kāi)放的生態(tài)系統(tǒng)中獲得了更多選擇,還可以讓AI應(yīng)用程序的開(kāi)發(fā)人員和終端用戶都從中獲益。
OCP對(duì)于開(kāi)發(fā)人員、用戶和系統(tǒng)集成商以及芯片提供商來(lái)說(shuō)都是一個(gè)很好的協(xié)同平臺(tái)?;贠CP平臺(tái),我們可以更好地確定我們的需求,更好地與合作伙伴,甚至是競(jìng)爭(zhēng)對(duì)手,一起合作,定義一種可以使整個(gè)生態(tài)系統(tǒng)受益的標(biāo)準(zhǔn)??偟膩?lái)說(shuō),正是這些成功的合作促成了我們最新的全機(jī)架人工智能計(jì)算產(chǎn)品——X-MAN 4.0的開(kāi)發(fā)。
—— 百度AI系統(tǒng)架構(gòu)師Richard Ding
OAI小組的工作范圍包括定義物理模塊,這些模塊涉及邏輯方面,例如電氣、機(jī)械、散熱、管理、硬件安全和物理可維護(hù)性等,生成與傳統(tǒng)現(xiàn)有操作系統(tǒng)兼容的解決方案,允許創(chuàng)建運(yùn)行異構(gòu)加速器應(yīng)用程序的框架。展望未來(lái),業(yè)界日益達(dá)成共識(shí),通過(guò)鼓勵(lì)采用標(biāo)準(zhǔn)和進(jìn)一步的實(shí)際應(yīng)用測(cè)試,AI生態(tài)系統(tǒng)可以通過(guò)標(biāo)準(zhǔn)化實(shí)現(xiàn)持續(xù)發(fā)展。
OAI項(xiàng)目圍繞設(shè)計(jì)模塊化架構(gòu)的理念進(jìn)行,這一架構(gòu)支持不同加速器和多系統(tǒng)的擴(kuò)展,從而輕松實(shí)現(xiàn)互連通信。未來(lái)OAI還需進(jìn)行標(biāo)準(zhǔn)的應(yīng)用推廣,在業(yè)內(nèi)獲取更多支持,從而在高性能計(jì)算生態(tài)系統(tǒng)和垂直市場(chǎng)中擴(kuò)大規(guī)模。隨著標(biāo)準(zhǔn)變得更具實(shí)際意義,可以通過(guò)實(shí)際應(yīng)用測(cè)試它的優(yōu)缺點(diǎn),然后對(duì)標(biāo)準(zhǔn)的技術(shù)進(jìn)行升級(jí)來(lái)滿足基于AI應(yīng)用程序的實(shí)際計(jì)算場(chǎng)景。浪潮致力于持續(xù)提高OAI標(biāo)準(zhǔn)的可擴(kuò)展性,并支持其市場(chǎng)普及。
作者簡(jiǎn)介
浪潮服務(wù)器產(chǎn)品部副總經(jīng)理張耀文(Alan Chang)
作為浪潮服務(wù)器產(chǎn)品部副總經(jīng)理,Alan致力于建立開(kāi)放硬件社區(qū),開(kāi)發(fā)下一代人工智能和5G網(wǎng)絡(luò)解決方案的架構(gòu),在硬件設(shè)計(jì)、市場(chǎng)協(xié)作等方面,為OCP做出了許多貢獻(xiàn)。在IT領(lǐng)域,Alan已有超十年的豐富經(jīng)驗(yàn),擔(dān)任過(guò)軟件程序員,負(fù)責(zé)開(kāi)發(fā)服務(wù)器產(chǎn)品和管理OxM帳戶的硬件產(chǎn)品開(kāi)發(fā)人員等各種角色。
宅家戰(zhàn)疫期間,歡迎大家點(diǎn)擊到DOIT學(xué)院訪問(wèn)學(xué)習(xí),祝愿大家 宅家學(xué)習(xí),天天向上!
DOIT學(xué)院以存儲(chǔ)和數(shù)據(jù)科技為基礎(chǔ),涵蓋大數(shù)據(jù)、云計(jì)算、人工智能、物聯(lián)網(wǎng)等領(lǐng)域,利用碎片化時(shí)間和靈活的學(xué)習(xí)方式幫助讀者快速專業(yè)知識(shí),成就更多DT專家。