打破馮·諾依曼結(jié)構(gòu),中國(guó)研發(fā)出第一款類腦芯片
人工智能技術(shù)(AI)現(xiàn)在已是如火如荼的發(fā)展著,各種傳感器,機(jī)器學(xué)習(xí),外圍設(shè)備五花八門(mén),然而,其核心的數(shù)據(jù)處理硬件架構(gòu)仍基于經(jīng)典的馮·諾依曼結(jié)構(gòu)。馮·諾依曼結(jié)構(gòu)已有七八十年歷史,這就好比已經(jīng)直立行走的智人,仍長(zhǎng)著一顆猩猩的腦袋。這就出現(xiàn)了馮·諾依曼瓶頸,也就是說(shuō)CPU再快,也要等內(nèi)存,因?yàn)镃PU和內(nèi)存之間的性能差距越來(lái)越大。
馮·諾依曼結(jié)構(gòu)
馮·諾依曼結(jié)構(gòu)中,計(jì)算模塊和存儲(chǔ)單元是分離的,CPU在執(zhí)行命令時(shí)必須先從存儲(chǔ)單元中讀取數(shù)據(jù)。每一項(xiàng)任務(wù),如果有十個(gè)步驟,那么CPU會(huì)依次進(jìn)行十次讀取,執(zhí)行,再讀取,再執(zhí)行。.. 這就造成了延時(shí),以及大量功耗(80%)花費(fèi)在了數(shù)據(jù)讀取上,當(dāng)然多核、多CPU或一些常用數(shù)據(jù)的就地存儲(chǔ)會(huì)一定程度上緩解這些問(wèn)題,但這種中心處理的架構(gòu)會(huì)限制處理能力的進(jìn)一步發(fā)展,好比諾大個(gè)北京城,如果所有的政治、經(jīng)濟(jì)、文化活動(dòng)都集中在市中心,為了生活,人們必須穿城而過(guò),任你路修到二十環(huán),還是一個(gè)詞,堵死。
學(xué)術(shù)界和工業(yè)界出現(xiàn)了向人類大腦學(xué)習(xí)體系結(jié)構(gòu)的趨勢(shì),大腦的處理單元是神經(jīng)元,內(nèi)存就是突觸。神經(jīng)元和突觸是物理相連的,所以每個(gè)神經(jīng)元計(jì)算都是本地的,而且從全局來(lái)看神經(jīng)元們是分布式在工作。
神經(jīng)元和突觸
前幾年轟動(dòng)全球的IBM的仿人腦芯片TrueNorth也模仿了人類大腦的神經(jīng)元結(jié)構(gòu),它的計(jì)算效率和可擴(kuò)展性都遠(yuǎn)超現(xiàn)在的計(jì)算機(jī),并且宣稱可用于手勢(shì)識(shí)別、情緒識(shí)別、圖像分類和對(duì)象追蹤、實(shí)時(shí)語(yǔ)音識(shí)別等領(lǐng)域。而記者采訪的團(tuán)隊(duì)AI-CTX,他們的模型基于億萬(wàn)個(gè)可以相互連接的仿生神經(jīng)元,每個(gè)神經(jīng)元都具有跟人腦神經(jīng)元類似的電學(xué)特性與動(dòng)態(tài)參數(shù),具有簡(jiǎn)單的運(yùn)算與存儲(chǔ)功能,這些神經(jīng)元像大腦神經(jīng)元一樣,通過(guò)脈沖相互溝通。
在現(xiàn)實(shí)層面,他們的每個(gè)芯片可以搭載百萬(wàn)個(gè)神經(jīng)元,億萬(wàn)個(gè)神經(jīng)突觸,可以自由擴(kuò)展的芯片網(wǎng)絡(luò)又如同大腦皮層的不同的區(qū)域,分別在不同的層級(jí)上, 可以并行的,同時(shí)的處理任務(wù),從而指數(shù)型地提高了數(shù)據(jù)處理的效率。又因各個(gè)指令及相應(yīng)數(shù)據(jù)都存儲(chǔ)在同一芯片中,所有的計(jì)算資源不會(huì)因?yàn)榈却鎯?chǔ)訪問(wèn)而導(dǎo)致浪費(fèi),功耗也比現(xiàn)在基于馮·諾依曼硬件架構(gòu)的處理器低兩到三個(gè)數(shù)量級(jí)。
看看Alpha Go,下一場(chǎng)棋耗電幾千瓦,而李世石,大腦只耗20瓦,所以雖然輸了,但人類的尊嚴(yán)還算沒(méi)有低到塵埃里。
李世石對(duì)陣Alpha Go
除了運(yùn)算速度快,能耗低,團(tuán)隊(duì)還有一項(xiàng)核心的IP,就是一種特殊的布線方式,使各芯片之間的交流可以突破物理限制,無(wú)限的增加新的芯片于原有網(wǎng)絡(luò),這樣,運(yùn)算能力也可無(wú)限增加。而傳統(tǒng)的馮·諾依曼結(jié)構(gòu),如果要增加CPU的數(shù)量,那么CPU之間的溝通是越發(fā)困難的,因?yàn)檫\(yùn)算能力有其上限。在處理AI領(lǐng)域數(shù)據(jù)上,AI-CTX團(tuán)隊(duì)基于仿生神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)出芯片架構(gòu)比之馮·諾依曼結(jié)構(gòu)無(wú)疑是革命性的,那么市場(chǎng)上是否有用類似方案的對(duì)手呢?
與IBM TrueNorth芯片的對(duì)比
CTO 喬寧很自信的說(shuō):“Intel,三星等正在研發(fā)的加速器類產(chǎn)品在實(shí)時(shí)處理動(dòng)態(tài)數(shù)據(jù)速度上比我們慢,能耗還高一個(gè)數(shù)量級(jí)。而跟IBM的TrueNorth芯片相比,我們的模擬神經(jīng)元具有更復(fù)雜的非線性參數(shù),硅面積只有IBM的0.5%,能耗只有10%,基于我們的芯片架構(gòu),每個(gè)神經(jīng)元能輕松建立多達(dá)8千個(gè)連接,而現(xiàn)有IBM Truenorth 芯片只有256個(gè)連接。而且我們第一代原型一出來(lái)就已經(jīng)有訂單了!”
當(dāng)然,我們也要在這里指出,三星的加速器是做靜態(tài)圖像處理,TrueNorth是一個(gè)通用實(shí)驗(yàn)芯片,不專門(mén)針對(duì)任何應(yīng)用,雖然已經(jīng)有不少人在開(kāi)發(fā)相應(yīng)的芯片應(yīng)用(識(shí)別,追蹤,決策)。
AI-CTX的芯片不適合處理靜態(tài)硬盤(pán)數(shù)據(jù)(靜態(tài)圖片及數(shù)據(jù)),但非常擅長(zhǎng)于處理包含時(shí)間信息的數(shù)據(jù),比如,動(dòng)態(tài)的傳感器數(shù)據(jù),自然界的自然信號(hào)(溫度,氣壓),人體信號(hào)(心跳EEG),網(wǎng)絡(luò)數(shù)據(jù),IoT,股票高速?zèng)Q策等數(shù)據(jù)的處理。
AI-CTX目前的主要切入的應(yīng)用場(chǎng)景包括實(shí)時(shí)在線(always-on)的應(yīng)用,比如低功耗的智能便攜設(shè)備,移動(dòng)設(shè)備,健康檢測(cè)EEG,IoT設(shè)備,網(wǎng)絡(luò)安全等。還有另一塊是高速低功耗應(yīng)用,比如自動(dòng)駕駛,手勢(shì)識(shí)別,聲音識(shí)別等。更長(zhǎng)遠(yuǎn)來(lái)看可以用于大數(shù)據(jù)處理和深度學(xué)習(xí)等領(lǐng)域。