國內(nèi)計算芯片新突破,AI將顛覆老架構(gòu)
物聯(lián)網(wǎng)的英文名為“the Internet of things”,簡稱IoT。它是將各種信息傳感設(shè)備與互聯(lián)網(wǎng)結(jié)合起來而形成的巨大網(wǎng)絡(luò),也是繼計算機(jī)、互聯(lián)網(wǎng)與移動通信網(wǎng)之后的又一次信息產(chǎn)業(yè)浪潮。物聯(lián)網(wǎng)主要通過射頻識別、紅外感應(yīng)器、全球定位系統(tǒng)、激光掃描器等信息傳感設(shè)備,按約定的協(xié)議將所有的“物”(小到手表、鑰匙,大到汽車、樓房等)與互聯(lián)網(wǎng)相連,進(jìn)行信息交換和通信,以實(shí)現(xiàn)對物品的智能化識別、定位、跟蹤、監(jiān)控和管理。
在這樣的背景下,存算一體(Computing In Memory,內(nèi)存內(nèi)計算)AI芯片應(yīng)運(yùn)而生。目前,不少國際上的領(lǐng)先企業(yè)和研究機(jī)構(gòu)正在致力于各種新型存儲器的研究,其中一個很大的驅(qū)動力就是希望能夠?qū)崿F(xiàn)具有更高效率的存算一體系統(tǒng),而在這其中,AI的融入也是一大趨勢。這些使得計算+存儲+AI的融合發(fā)展成為了一大方向。
不僅是在國際上,最近幾年,我國本土的一些企業(yè)和科研院所也在致力于這方面的研究工作。就在上周,合肥恒爍半導(dǎo)體科技公司與中國科大團(tuán)隊歷時兩年共同研發(fā)的基于NOR閃存架構(gòu)的存算一體AI芯片系統(tǒng)演示順利完成。這是國際領(lǐng)先的超低功耗存算一體的人工智能芯片。據(jù)悉,該芯片是一款具有邊緣計算和推理能力的AI芯片,能實(shí)時檢測通過攝像頭拍攝的人臉頭像并給出計算概率,可廣泛應(yīng)用于森林防火中的人臉識別與救援、心電圖的實(shí)時監(jiān)測、人工智能在人臉識別上的硬件解決方案等。
這也是我國本土企業(yè)在基于NOR閃存架構(gòu)的存算一體AI芯片領(lǐng)域的又一次突破,實(shí)際上,在該領(lǐng)域,恒爍半導(dǎo)體并不是唯一一家,還有其它一些企業(yè)也在進(jìn)行著基于NOR閃存架構(gòu)的低功耗AI芯片的研究工作。那么,作為一種傳統(tǒng)的、非前沿的存儲技術(shù),NOR閃存架構(gòu)有怎樣的特點(diǎn)和優(yōu)勢,能夠使得這些企業(yè)對其投入資源和人力,進(jìn)行相應(yīng)的低功耗AI芯片和系統(tǒng)研發(fā)呢?
存算一體的優(yōu)勢
在談基于NOR閃存架構(gòu)AI芯片的特點(diǎn)和優(yōu)勢之前,先來看一下存算一體芯片的優(yōu)勢及其能夠解決的主要問題。
目前來看,不論是PC還是超算,處理器和存儲芯片都是分離的,這就是馮諾依曼50多年前確立的計算架構(gòu)。隨著技術(shù)的發(fā)展,存儲計算分離的架構(gòu)瓶頸越來越明顯。
一般芯片的設(shè)計思路是增加大量的并行計算單元,比如上千個AI卷積單元,這樣,需要調(diào)用的存儲資源也在增大,然而,在傳統(tǒng)的計算架構(gòu)當(dāng)中,存儲一直是有限且稀缺的資源,隨著運(yùn)算單元的增加,每個單元能夠使用的存儲器的帶寬和大小將逐漸減小,而隨著人工智能時代的到來,這種矛盾顯得愈加突出,特別是對于物聯(lián)網(wǎng)來說,網(wǎng)絡(luò)的每一層,現(xiàn)有權(quán)重和每個AI訓(xùn)練示例的元素都被加載到處理器的寄存器中,然后相乘,并將結(jié)果寫回到存儲器中。這樣,性能瓶頸就不是在計算一側(cè)了,而是處理器和存儲器陣列之間的帶寬。存儲器和處理器之間的這種分離是馮·諾依曼架構(gòu)的定義特征之一,并且存在于幾乎所有現(xiàn)代計算系統(tǒng)中。
這種“存儲墻”的高起正在阻礙著AI產(chǎn)業(yè)的發(fā)展,可以說,存儲器是AI芯片發(fā)展的最大瓶頸。
在很多AI推理運(yùn)算中,90%以上的運(yùn)算資源都消耗在數(shù)據(jù)搬運(yùn)的過程中。芯片內(nèi)部到外部的帶寬,以及片上緩存空間限制了運(yùn)算的效率。因此,在業(yè)界和學(xué)術(shù)界,越來越多的人認(rèn)為存算一體化是未來的趨勢,可以很好地解決“存儲墻”問題。
如果能夠讓計算和內(nèi)存更緊密地結(jié)合在一起,甚至是在內(nèi)存內(nèi)進(jìn)行計算,就可以大幅提升數(shù)據(jù)的傳輸效率,同時節(jié)省更多的電能,因?yàn)樵趦?nèi)存和計算之間不再需要往返太多次數(shù),一切處理過程都再同一芯片內(nèi)完成了。
分類
為了應(yīng)對物聯(lián)網(wǎng)以及存算一體的應(yīng)用需求,各種新型的、傳統(tǒng)的存儲技術(shù)和器件紛紛登場,想在這些新興應(yīng)用方面盡量地施展出自己的才華。
過去50年中,SRAM、DRAM和Flash已經(jīng)成為存儲器的主力,這些存儲結(jié)構(gòu)在往更小的幾何結(jié)構(gòu)微縮的過程中都存在問題,很重要的原因在于它們都是平面結(jié)構(gòu),而新的存儲技術(shù),如基于電阻開關(guān)的存儲技術(shù)是金屬層結(jié)構(gòu),消除了許多制造問題。然而,由于DRAM和Flash技術(shù)已經(jīng)非常成熟,成本又很低。所以,它們在存算一體方面依然有獨(dú)到的優(yōu)勢,也正在被一些企業(yè)所采用
目前來看,新型的存儲技術(shù)主要包括相變存儲器(PCM)、鐵電存儲器(FeRAM)、磁阻RAM(MRAM)、電阻RAM(RRAM或 ReRAM)、自旋轉(zhuǎn)移力矩RAM(STT-RAM)、導(dǎo)電橋RAM(CBRAM),以及氧化物電阻存儲器(OxRAM)等?;谶@些的存算一體研究或多或少地都在進(jìn)行著,相應(yīng)的成果也經(jīng)常見諸于報端。以上這些都是新技術(shù),目前來看,它們的主要問題就是成本,以及生態(tài)系統(tǒng)的完整度,還需要一些發(fā)展時間才能成氣候。
而從存儲與計算的結(jié)合方式來看,存算一體又可以分為兩大類:一是在DRAM中植入邏輯計算單元,被稱為內(nèi)存內(nèi)處理或者近數(shù)據(jù)計算,這種方式非常適合云端的大數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò)訓(xùn)練等應(yīng)用;二是存儲和計算完全結(jié)合在一起,存儲器件也即計算單元,如采用基于NOR閃存架構(gòu)的存算一體AI芯片,其主要特點(diǎn)是能耗低、運(yùn)算效率高、速度快且成本低,這種形式比較適合邊緣側(cè)的神經(jīng)網(wǎng)絡(luò)推理等應(yīng)用。
NOR閃存架構(gòu)的優(yōu)勢
基于NOR閃存架構(gòu)的存算一體AI芯片,利用NOR Flash的模擬特性,可直接在存儲單元內(nèi)進(jìn)行全精度矩陣卷積運(yùn)算(乘加運(yùn)算)。規(guī)避了數(shù)據(jù)在ALU和存儲器之間來回傳輸?shù)钠款i,從而使功耗大幅降低、提高了運(yùn)算效率。
其Flash存儲單元可以存儲神經(jīng)網(wǎng)絡(luò)的權(quán)重參數(shù),同時還可以完成和此權(quán)重相關(guān)的乘加法運(yùn)算,從而將乘加法運(yùn)算和存儲融合到了一個Flash單元里面。例如,100萬個Flash單元可以存儲100萬個權(quán)重參數(shù),同時還可以并行完成100萬次乘加法運(yùn)算。
在這樣的芯片里面,深度學(xué)習(xí)網(wǎng)絡(luò)可以被映射到多個Flash陣列,這些Flash陣列不僅可以存儲數(shù)據(jù),其深度學(xué)習(xí)網(wǎng)絡(luò)同時還能完成AI推理,注意,這個過程是不需要額外邏輯計算電路的,一切處理都在這一塊芯片內(nèi)完成。相比于傳統(tǒng)的馮諾依曼架構(gòu)深度學(xué)習(xí)芯片,這種的運(yùn)算效率非常高,而且成本低廉,因?yàn)槭∪チ薉RAM、SRAM以及片上并行計算單元,從而簡化了系統(tǒng)設(shè)計。
目前來看,這種基于NOR閃存架構(gòu)的存算一體AI芯片,其主要應(yīng)用領(lǐng)域就是對成本和運(yùn)算效率(特別是功耗)敏感的應(yīng)用,如邊緣側(cè)的低功耗、低成本語音識別等。而隨著人工智能和物聯(lián)網(wǎng)的發(fā)展,它還可以拓展更多的應(yīng)用場景。
結(jié)語
無論是新型存儲技術(shù),還是以NOR閃存為代表的老牌技術(shù),在發(fā)展存算一體AI芯片方面,都需要不斷完善生態(tài)系統(tǒng)建設(shè),才能使整個產(chǎn)業(yè)發(fā)展起來。
因此,除了存儲和計算技術(shù)本身之外,行業(yè)相關(guān)的接口標(biāo)準(zhǔn)跟進(jìn)特別重要,特別是對于以存儲為基礎(chǔ)的新型應(yīng)用來說,更加重要。另外,由于芯片內(nèi)部集中了越來越多的功能塊,片內(nèi)總線和片內(nèi)網(wǎng)絡(luò)系統(tǒng)成為了一個新的課題,目前,這方面的研究和新技術(shù)越來越受到業(yè)界的重視,新的技術(shù)和IP也陸續(xù)推出。