8月20日,“啟明920”由清華大學交叉信息研究院馬愷聲教授領銜的西安交叉核心院芯片中心研發(fā)成功并完成測試,這在我國芯片領域具有重大意義。而在9月15日,2020西安全球硬科技創(chuàng)新大會分論壇——“下一代AI芯片產(chǎn)業(yè)發(fā)布暨Chiplet產(chǎn)業(yè)聯(lián)盟啟動成立圓桌論壇”將于高新國際會議中心丈八廳盛大啟幕。屆時,將重磅發(fā)布“啟明920”AI加速芯片(以下簡稱“啟明920”)。
一、面向低速自動駕駛,硬件峰值有效加速比近9倍
“啟明920”通過軟硬件協(xié)同設計的思路,對使用圖案剪枝(已申請專利)優(yōu)化的模型,采用了特定技術,實現(xiàn)存儲優(yōu)化與計算加速,能夠?qū)⑸窠?jīng)網(wǎng)絡模型實現(xiàn)最高4.5倍的存儲壓縮,同時充分發(fā)揮硬件稀疏計算的效率,硬件加速比可達3.5倍,而神經(jīng)網(wǎng)絡模型精度損害僅在1%以內(nèi)。
“啟明920”進一步利用卷積核剪枝技術,與圖案剪枝技術相兼容,進而實現(xiàn)最大合計11.25倍的模型存儲壓縮,硬件峰值有效加速比近9倍,可充分縮短計算時間。此外,“啟明920”通過統(tǒng)一架構對多模式的數(shù)據(jù)量化提供高效的支持,可適配線性與非線性權重參數(shù)的量化方法,可適配不同使用場景的需求。
“啟明920”在片外訪存的設計上,對DRAM訪問做了專門優(yōu)化,充分復用處理單元資源,一方面采用數(shù)據(jù)“即到即算”的策略縮短計算延時;另一方面采用交替更新激活與權重的形式,減少片外帶寬需求。
通過上述技術創(chuàng)新,“啟明920”可面向高能效的低速無人車、AGV、計算機視覺加速等AI應用場景。
二、歷時九個月,“啟明920”研發(fā)神速
2019年12月24日,高新區(qū)首顆AI加速芯片“啟明 910” 研發(fā)成功后,在馬愷聲教授的帶領下,西安交叉核心院芯片中心正式啟動“啟明920”AI加速芯片研發(fā)。3月中旬,西安交叉核心院全面復工,研發(fā)團隊全員集結,加速推進研發(fā)工作。
在此期間,研發(fā)團隊取得多項相關研究成果,在CVPR、DAC等國際頂會發(fā)布論文3篇,并申請國內(nèi)發(fā)明專利5項。經(jīng)過月余的攻堅克難,4月27日,芯片正式在聯(lián)電流片;7月15日,“啟明920”流片完成;歷時一個月,8月20日研發(fā)團隊完成芯片測試并全面達標。
三、“啟明930”啟動研發(fā)
“啟明920”的研發(fā)成功是國產(chǎn)芯片加速發(fā)展的一個縮影,也是西安交叉核心院推進基礎前沿科技研究的全新起點。
“啟明920”研發(fā)成功后,西安交叉核心院迅速啟動研發(fā)“啟明930”AI加速芯片,該款芯片將實現(xiàn)可擴展、高性能的設計,直接面向計算密集型的自動駕駛應用場景。