近日,清華大學官宣交叉團隊發(fā)布中國 AI 光芯片 “太極(Taichi)”,該研究成果于 4 月 12 日發(fā)表在了最新一期學術(shù)期刊《Science》上。
據(jù)介紹,“太極” 光芯片架構(gòu)開發(fā)過程中的靈感來自中國典籍《周易》,團隊成員以 “易有太極,是生兩儀” 為啟發(fā),建立了全新的計算模型,實現(xiàn)了光計算強悍性能的釋放。
正所謂巧婦難為無米之炊,算力是訓練 AI 大模型、推理任務(wù)的關(guān)鍵,也是人工智能的硬件基礎(chǔ)。
光計算,顧名思義是將計算載體從電變?yōu)楣?,利用光在芯片中的傳播進行計算,以其超高的并行度和速度,被認為是未來顛覆性計算架構(gòu)的最有力競爭方案之一。
光芯片具備高速高并行計算優(yōu)勢,被寄予希望用來支撐大模型等先進人工智能應(yīng)用。如何制造出兼具大算力和高能效的下一代 AI 芯片已成為國際前沿熱點,而本次清華大學發(fā)布的 “太極” 光芯片將有望為大模型訓練推理、通用人工智能、自主智能無人系統(tǒng)等提供強大的算力支持。
光電智能技術(shù)交叉創(chuàng)新團隊部分成員合影(左三為戴瓊海院士、右二為方璐副教授)
作為近年來新興的計算模態(tài),智能光計算具備高速、低功耗等特性,在后摩爾時代擁有超越硅基電子計算的潛力,可以突破性解決人工智能領(lǐng)域的算力與功耗難題。
可是其痛點在于,光的計算優(yōu)勢被困在了 “水土不服” 的電架構(gòu)中,導致計算規(guī)模受限,無法支撐復雜大模型智能計算。
對此,清華大學電子工程系方璐副教授課題組、自動化系戴瓊海院士課題組摒棄了傳統(tǒng)電子深度計算范式構(gòu)建智能光計算通用傳播模型,另辟蹊徑地首創(chuàng)了分布式廣度智能光計算架構(gòu),研制出全球首款大規(guī)模干涉衍射異構(gòu)集成芯片 “太極(Taichi)”,實現(xiàn)了 160 TOPS/W 的通用智能計算。
相異于電子神經(jīng)網(wǎng)絡(luò)依賴網(wǎng)絡(luò)深度以實現(xiàn)復雜的計算與功能,“太極” 光芯片架構(gòu)源自光計算獨特的全連接與高并行屬性,化深度計算為分布式廣度計算,為實現(xiàn)規(guī)模易擴展、計算高并行、系統(tǒng)強魯棒的通用智能光計算探索了新路徑。
每一個研究成果都匯集了每一位成員的心血,方璐教授將本次科研比擬為浪漫的雙向奔赴:從算法架構(gòu)上自頂向下探索,在硬件芯片設(shè)計上自底向上推演。
據(jù)論文第一作者、電子系博士生徐智吳介紹,在 “太極” 架構(gòu)中,自頂向下的編碼拆分-解碼重構(gòu)機制,將復雜智能任務(wù)化繁為簡,拆分為多通道高并行的子任務(wù),構(gòu)建的分布式 “大感受野” 淺層光網(wǎng)絡(luò)對子任務(wù)分而治之,突破物理模擬器件多層深度級聯(lián)的固有計算誤差。
團隊以周易典籍 “易有太極,是生兩儀” 為啟發(fā),建立干涉-行射聯(lián)合傳播模型,融合衍射光計算大規(guī)模并行優(yōu)勢與干涉光計算靈活重構(gòu)特性,將衍射編解碼與干涉特征計算進行部分/整體重構(gòu)復用,以時序復用突破通量瓶頸,自底向上支撐分布式廣度光計算架構(gòu),為片上大規(guī)模通用智能光計算探索了新路徑。
論文報道,“太極” 光芯片具備 879 T MACS/mm^2 的面積效率與 160 TOPS/N 的能量效率。首次賦能光計算實現(xiàn)自然場景千類對象識別、跨模態(tài)內(nèi)容生成等人工智能復雜任務(wù)。
清華大學團隊在實驗環(huán)境下,實現(xiàn)了片上(on-chip)1396 萬光神經(jīng)網(wǎng)絡(luò)(ONN),可用于復雜的千類別級分類和人工智能生成內(nèi)容任務(wù)。
此外,太極光芯片的計算能效超現(xiàn)有智能芯片 2—3 個數(shù)量級,可為百億像素大場景光速智能分析、百億參數(shù)大模型訓練推理、毫瓦級低功耗自主智能無人系統(tǒng)提供算力支撐。
方璐教授表示,之所以將光芯片命名為 “太極”,也是希望可以在如今大模型通用人工智能蓬勃發(fā)展的時代,以光子之道,為高性能計算探索新靈感、新架構(gòu)、新路徑。