當(dāng)前位置:首頁(yè) > 智能硬件 > 人工智能AI
[導(dǎo)讀] 在12月初舉辦的NeurIPS會(huì)議上,IBM展示了一款新型人工智能芯片。 IBM的研究人員聲稱,他們已開發(fā)出一個(gè)更加高效的模型用于處理神經(jīng)網(wǎng)絡(luò),該模型只需使用8位浮點(diǎn)精度進(jìn)行訓(xùn)練,推理(

在12月初舉辦的NeurIPS會(huì)議上,IBM展示了一款新型人工智能芯片。

IBM的研究人員聲稱,他們已開發(fā)出一個(gè)更加高效的模型用于處理神經(jīng)網(wǎng)絡(luò),該模型只需使用8位浮點(diǎn)精度進(jìn)行訓(xùn)練,推理(inferencing)時(shí)更是僅需4位浮點(diǎn)精度。該研究的成果已于2018年12月初在國(guó)際電子元件會(huì)議(International Electron Devices MeeTIng,IEDM)和神經(jīng)信息處理系統(tǒng)大會(huì)(Conference on NeuralInformaTIon Processing Systems,NeurIPS)上發(fā)布。

簡(jiǎn)而言之,IBM展示了專用于減少精度處理單元的定制硬件,以及能夠利用該硬件進(jìn)行深度神經(jīng)網(wǎng)絡(luò)(DNN)訓(xùn)練和推理的新算法。其主要目標(biāo)在于提高硬件的能效,使其可以應(yīng)用于范圍更廣泛的人工智能解決方案。

下一代人工智能應(yīng)用程序需要更快的響應(yīng)時(shí)間、更大的人工智能工作負(fù)載以及來自眾多數(shù)據(jù)流的多模式數(shù)據(jù)。為了釋放人工智能的全部潛能,我們重新設(shè)計(jì)了將人工智能考慮在內(nèi)的硬件:從加速器到用于人工智能工作負(fù)載的特定用途硬件(例如我們的新芯片),以及最終用于人工智能的量子計(jì)算技術(shù)。使用新的硬件解決方案擴(kuò)展人工智能是IBM研究院(IBM Research)更廣泛努力的一部分,以期從范圍狹窄的人工智能(通常用于處理具體的、界限清楚的任務(wù))轉(zhuǎn)向范圍廣泛的人工智能(跨越各個(gè)學(xué)科,可幫助人類解決最迫切的問題)。

具體而言,IBM研究院提出了可提供8位浮點(diǎn)(FP8)精度用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的硬件。8位浮點(diǎn)精度是16位浮點(diǎn)精度(FP16)的一半,而16位浮點(diǎn)精度自2015年以來一直是深度神經(jīng)網(wǎng)絡(luò)工作的事實(shí)標(biāo)準(zhǔn)。(提議的硬件將依靠FP16來累積點(diǎn)積,而不是現(xiàn)在使用的FP32。)借助于稍后介紹的新算法技術(shù),IBM的研究人員表示,他們可以跨各種深度學(xué)習(xí)模型保持精確度。事實(shí)上,他們記錄在案了使用FP8精度基于圖像、語(yǔ)音和文本數(shù)據(jù)集對(duì)深度神經(jīng)網(wǎng)絡(luò)所進(jìn)行的訓(xùn)練,并實(shí)現(xiàn)了與基于FP32的訓(xùn)練相當(dāng)?shù)哪P途_度。

降低精度的模型基于三項(xiàng)軟件創(chuàng)新:一種新的FP8格式,讓用于深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練的矩陣乘法和卷積計(jì)算可在不損失精確度的情況下工作;一種“基于組塊的計(jì)算”技術(shù),使得只需使用FP8乘法和FP16加法即可處理神經(jīng)網(wǎng)絡(luò)成為現(xiàn)實(shí);并且在加權(quán)更新過程中使用浮點(diǎn)隨機(jī)舍入,允許以16位浮點(diǎn)精度(而不是32位浮點(diǎn)精度)計(jì)算這些更新。

IBM展示的硬件是一款基于“新式數(shù)據(jù)流核心”的14納米處理器。該處理器由降低精度的數(shù)據(jù)流引擎、16位浮點(diǎn)精度組塊加法引擎和核心上內(nèi)存及內(nèi)存訪問引擎組成。研究人員聲稱,與現(xiàn)在的平臺(tái)相比,這種設(shè)計(jì)有可能使訓(xùn)練速度提高2到4倍。其中部分改進(jìn)是用于訓(xùn)練模型的位寬減少了2倍的結(jié)果,但其余改進(jìn)則是因?yàn)橛糜诶媒档偷木鹊能浖夹g(shù)。

也許更重要的是,IBM研究院表示,由于其FP8/FP16模型相較標(biāo)準(zhǔn)FP16/FP32模型而言所需的內(nèi)存帶寬和存儲(chǔ)空間更少,并且因?yàn)槠溆布菫樘幚磉@些神經(jīng)網(wǎng)絡(luò)而定制的,能效可提高2-4倍以上。研究人員表示,這將使深度神經(jīng)網(wǎng)絡(luò)模型能夠在一些邊緣設(shè)備上進(jìn)行訓(xùn)練,而不僅僅是在數(shù)據(jù)中心服務(wù)器上進(jìn)行訓(xùn)練。

研究人員還發(fā)表了一篇關(guān)于在多個(gè)深度學(xué)習(xí)應(yīng)用程序中使用4位浮點(diǎn)精度推理,而同樣不損失精確度的論文(目前,大部分推理基于使用8位浮點(diǎn)精度或更多位浮點(diǎn)精度的計(jì)算)。此處的意義在于,位寬的減小將再次提高吞吐量和能效。對(duì)降低精度的需求也使得基于在訓(xùn)練期間優(yōu)化的位精度構(gòu)建用于訓(xùn)練和推理的統(tǒng)一架構(gòu)更加自然。根據(jù)研究人員的說法,由于減少了專用于計(jì)算的處理器面積并擁有在內(nèi)存中保留模型和激活數(shù)據(jù)的能力,此類硬件可以帶來推理性能的超線性提升。

相關(guān)研究領(lǐng)域需要與將這種降低精度的模型應(yīng)用于模擬芯片相關(guān),模擬芯片天生不如數(shù)字芯片精確,但能效卻高得多。IBM的研究人員開發(fā)了一種使用相變存儲(chǔ)器(PCM)的8位浮點(diǎn)精度模擬加速器,它可以充當(dāng)用于處理神經(jīng)網(wǎng)絡(luò)的計(jì)算基板和存儲(chǔ)介質(zhì)。根據(jù)2018年早些時(shí)候發(fā)布的工作成果,IBM研究院已經(jīng)實(shí)施了該技術(shù)的創(chuàng)新加成,稱為預(yù)測(cè)PCM(Projected PCM,Proj-PCM),它可以減少PCM硬件的一些令人煩惱的不精確性。研究團(tuán)隊(duì)認(rèn)為,該設(shè)計(jì)可為物聯(lián)網(wǎng)(IoT)和邊緣設(shè)備等功率受限環(huán)境中的人工智能訓(xùn)練和推理提供高性能水平。

盡管所有這些仍處于研究階段,但I(xiàn)BM顯然對(duì)構(gòu)建自己的人工智能芯片和加速器并將其交付到客戶手中感興趣。他們計(jì)劃如何將該技術(shù)商業(yè)化仍然有待觀察。無論如何,如果降低精度的訓(xùn)練和推理流行起來,IBM將面臨很多競(jìng)爭(zhēng)。這些競(jìng)爭(zhēng)不僅僅來自將相應(yīng)調(diào)整自己的處理器平臺(tái)的英特爾英偉達(dá)等行業(yè)巨頭,它們還來自似乎每天都在涌現(xiàn)的人工智能芯片初創(chuàng)公司。在一個(gè)如此飛速變化的環(huán)境中,成功將青睞于最靈活變通的參與者。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉