在不同領(lǐng)域埋下座位,深挖三星強大的背后
物聯(lián)網(wǎng)配合人工智能將會給社會帶來巨大的變化,然而目前基于深度學(xué)習(xí)的芯片難以實現(xiàn)物聯(lián)網(wǎng)對于低功耗的需求。這時候就是神經(jīng)模態(tài)芯片大展身手的地方。
神經(jīng)模態(tài)計算目前或許只要把神經(jīng)元的數(shù)量和神經(jīng)突觸連接數(shù)量跨過一個閾值,那么神經(jīng)模態(tài)計算就有可能爆發(fā)出巨大的能量,甚至遠(yuǎn)超之前的想象。
GPU在AI主導(dǎo)地位將終結(jié)
IBM大膽預(yù)測,GPU在AI中的主導(dǎo)地位正在結(jié)束。GPU能夠為圖形處理進行大量的并行矩陣乘法運算,這種矩陣乘法碰巧與神經(jīng)網(wǎng)絡(luò)所需的完全相同。
因為沒有那些GPU,我們永遠(yuǎn)無法達(dá)到今天在AI性能方面已經(jīng)達(dá)到的性能水平。但是,隨著更多企業(yè)已經(jīng)掌握了更關(guān)于如何實現(xiàn)人工智能的知識,他們也在尋找設(shè)計出更高效硬件的方法和途徑。
工程界已經(jīng)意識到,降低能耗的關(guān)鍵是盡量減少計算架構(gòu)中出現(xiàn)數(shù)據(jù)必須從內(nèi)存遷移到處理器用于計算的這一情況發(fā)生,因為這樣的遷移需要耗費大量時間和精力。
模擬技術(shù)天然適合邊緣的人工智能。模擬計算需要低功耗,證明它具有高能效,但卻不準(zhǔn)確。模擬正在回歸,因為內(nèi)存計算與模擬計算可以相互配合。內(nèi)存陣列負(fù)責(zé)神經(jīng)網(wǎng)絡(luò)權(quán)重,模擬元件負(fù)責(zé)求和和觸發(fā)。
而人工智能學(xué)科發(fā)展與人類智能差距之一就是對多模態(tài)信息的智能化理解。人造信息量帶來了更大多樣性,視覺、聲音、符號語言、嗅覺和觸覺等信息,具有無限多樣性。
神經(jīng)模態(tài)計算的重要意義
①目前的深度學(xué)習(xí)僅能實現(xiàn)人類大腦極小一部分的功能,距離人類的智能還有非常遠(yuǎn)的距離,而使用神經(jīng)模態(tài)計算直接模仿神經(jīng)元系統(tǒng)在人工神經(jīng)元數(shù)量足夠多時,或?qū)⒂邢M軐崿F(xiàn)比起深度學(xué)習(xí)更好的效果,更接近人類大腦。
②目前深度學(xué)習(xí)計算在部署上遇到的困難是能效比和延遲問題,在對于功耗要求非常低的物聯(lián)網(wǎng)領(lǐng)域,以及對于延遲要求非常高的領(lǐng)域無人駕駛領(lǐng)域,部署深度學(xué)習(xí)會遇到很大的挑戰(zhàn)。
恰好神經(jīng)模態(tài)計算則可以解決這兩大問題
①神經(jīng)模態(tài)計算的一大優(yōu)勢就是其計算功耗與輸入有關(guān),在輸入不會激活大量神經(jīng)元的情況下,其功耗可以做到非常低。
②對于物聯(lián)網(wǎng)應(yīng)用來說,神經(jīng)模態(tài)計算可以利用這樣的規(guī)律,僅僅在需要的時候激活神經(jīng)元消費能量來完成事件識別,而在其他沒有事件的時候由于神經(jīng)元未被激活因此功耗很低,從而實現(xiàn)遠(yuǎn)低于深度學(xué)習(xí)芯片的平均功耗。
③神經(jīng)模態(tài)計算并非常規(guī)的馮諾伊曼架構(gòu),神經(jīng)模態(tài)計算芯片一般也不會搭配DRAM使用,而是直接將信息儲存在了神經(jīng)元里。這樣就避免了內(nèi)存墻帶來的功耗和延遲問題,因此神經(jīng)模態(tài)計算芯片的延遲和能效比都會好于傳統(tǒng)的深度學(xué)習(xí)。
神經(jīng)模態(tài)芯片發(fā)展的方向
①神經(jīng)模態(tài)芯片的發(fā)展方向首先是規(guī)?;磾U大神經(jīng)元的規(guī)模,這也是Intel和IBM等大廠主要押注的方向。
②利用神經(jīng)模態(tài)計算低功耗和低延遲的特點并進一步優(yōu)化芯片設(shè)計來開發(fā)出高能效比低延遲的芯片。這類芯片或許神經(jīng)元數(shù)量不多,但是可以實現(xiàn)非常低的功耗和非常好的能效比,從而可以部署在傳統(tǒng)深度學(xué)習(xí)無法部署的場景。
神經(jīng)模態(tài)芯片的商業(yè)化落地
①對于Intel和IBM這類在大規(guī)模神經(jīng)元領(lǐng)域大量投資的公司,更看重在這幾年內(nèi)把神經(jīng)模態(tài)計算的研究、生態(tài)先做起來,等到神經(jīng)模態(tài)計算研究取得突破時就能獲得先機。
②在中等規(guī)模神經(jīng)元規(guī)模、主打低功耗的神經(jīng)模態(tài)芯片方向上,物聯(lián)網(wǎng)將會成為最佳的落地應(yīng)用。
多模態(tài)人工智能存在不少難點
①數(shù)據(jù)模態(tài)多種多樣,包括2D圖像、3D模型、結(jié)構(gòu)化信息、文本、聲音及更多無法量化的數(shù)據(jù)。
②多模態(tài)數(shù)據(jù)的不對應(yīng),如從圖像到文字,從文字到圖像,都是“一對多”的過程,會有多種的描述和呈現(xiàn)。
③多模態(tài)數(shù)據(jù)的融合,一個軟件或算法的進步較為容易,但多個算法一起,難度將幾何級上升,要經(jīng)過語言模型、三維建模、自動尋路、圖像分析這些步驟。
④多模態(tài)監(jiān)督。
AI芯片向多模態(tài)演進
目前,物聯(lián)網(wǎng)和人工智能都是發(fā)展大勢,而AI芯片正處于從通用型向?qū)S眯桶l(fā)展和轉(zhuǎn)化的過程當(dāng)中,特別是在物聯(lián)網(wǎng)邊緣側(cè),通用型AI芯片的計算效率較低,繼而帶來了成本和功耗的失配。
在物聯(lián)網(wǎng)應(yīng)用初期,很多AI芯片都是以單模態(tài)功能切入市場的,最為普遍的就是語音應(yīng)用。但是未來的應(yīng)用會是多模態(tài)融合的,機器人就是一個典型的多模態(tài)應(yīng)用實例,還有如車載芯片,因此多模態(tài)是市場發(fā)展的必然趨勢。
對于架構(gòu),雖然每家芯片企業(yè)的架構(gòu)都有各自的特點和實現(xiàn)方法,支持機器學(xué)習(xí)的算法會逐漸形成統(tǒng)一的框架。未來有可能形成在不同AI芯片硬件上面,可以運行所有神經(jīng)網(wǎng)絡(luò)的模型,這在不久的將來是完全有可能出現(xiàn)的。
隨著5G和物聯(lián)網(wǎng)的大面積鋪開,低功耗AI芯片將是未來的主要發(fā)展方向,只要相關(guān)標(biāo)準(zhǔn)能夠確定,則商機無限。
企業(yè)先后跨足神經(jīng)形態(tài)領(lǐng)域
雖然2016年時在航空、軍事與國防、汽車、消費、醫(yī)療、金融服務(wù)、基礎(chǔ)設(shè)施和公用事業(yè)等產(chǎn)業(yè)中使用神經(jīng)形態(tài)技術(shù)的應(yīng)用并不多,但在接下來的十年,這些產(chǎn)業(yè)將開始大量采用神經(jīng)形態(tài)技術(shù)。
像IBM、Intel、惠普等巨擘都跨足這個領(lǐng)域,為神經(jīng)形態(tài)晶片開發(fā)硬體,同時,高通也計劃在2018年以前商用化其認(rèn)知運算與機器學(xué)習(xí)平臺Zeroth,從而將神經(jīng)形態(tài)功能整合在嵌入式系統(tǒng)中。
整體神經(jīng)形態(tài)晶片市場在2016年時約有12億美元的價值,并以26.3%的復(fù)合年成長率成長,在2022年時達(dá)到48億美元的市場規(guī)模。
而這還不包括消費終端產(chǎn)業(yè),而是指由工業(yè)檢測、航空、軍事與國防等領(lǐng)域所帶動的神經(jīng)形態(tài)晶片市場需求。到2022年,亞洲將占據(jù)一半以上的神經(jīng)形態(tài)市場。
國內(nèi)神經(jīng)模態(tài)芯片被重視
國內(nèi)神經(jīng)模態(tài)芯片得到了國家和業(yè)界的重視。清華類腦計算中心做出了卓越的貢獻(xiàn),其工作發(fā)表在全球頂級期刊和會議上。上海也于今年建立了上海腦科學(xué)與類腦研究中心,神經(jīng)模態(tài)計算是該中心的重點方向之一。
在商業(yè)化方面,清華類腦計算中心孵化的初創(chuàng)公司靈汐科技在今年發(fā)布了自主研發(fā)的“天機二代”芯片系統(tǒng),使用眾核存算一體架構(gòu),具有高速度、高性能、低功耗的特點。
相比國外同行,我國的神經(jīng)模態(tài)計算在最近幾年得到了來自國家非常高的重視,相信在未來幾年內(nèi)將會有全球領(lǐng)先的成果誕生。
過去幾年,尹首一副教授針對這一前沿課題,領(lǐng)銜研究和設(shè)計了可重構(gòu)多模態(tài)混合神經(jīng)計算芯片(代號Thinker)。
Thinker芯片基于該團隊長期積累的可重構(gòu)計算芯片技術(shù),采用可重構(gòu)架構(gòu)和電路技術(shù),突破了神經(jīng)網(wǎng)絡(luò)計算和訪存的瓶頸,實現(xiàn)了高能效多模態(tài)混合神經(jīng)網(wǎng)絡(luò)計算。
Thinker芯片具有高能效的突出優(yōu)點,其能量效率相比目前在深度學(xué)習(xí)中廣泛使用的GPU提升了三個數(shù)量級。
其支持電路級編程和重構(gòu),是一個通用的神經(jīng)網(wǎng)絡(luò)計算平臺,可廣泛應(yīng)用于機器人、無人機、智能汽車、智慧家居、安防監(jiān)控和消費電子等領(lǐng)域。
結(jié)尾:
目前Intel和IBM在內(nèi)的企業(yè)正積極探索超低功耗神經(jīng)模態(tài)芯片在不同領(lǐng)域的應(yīng)用,在未來幾年內(nèi)隨著AI+IoT的發(fā)展,神經(jīng)模態(tài)計算將會迎來一波新的熱潮。
目前如何高效訓(xùn)練大規(guī)模神經(jīng)模態(tài)神經(jīng)元的算法還沒有找到,因此在現(xiàn)有訓(xùn)練框架的基礎(chǔ)下,或許優(yōu)先把能效比做到極致是比把神經(jīng)元數(shù)量做大更接地氣的方向。