在2021世界人工智能大會同期,燧原科技舉辦新品發(fā)布會,推出其第二代人工智能訓練產品組合,即“邃思2.0”芯片、基于邃思2.0的“云燧T20”訓練加速卡和“云燧T21”訓練OAM模組,更新了軟件平臺“馭算TopsRider”,還推出了全新服務器產品云燧智算集群CloudBlazer Matrix 2.0。

隨著內容視頻化與萬物互聯(lián)進一步發(fā)展,全球產生的數(shù)字化數(shù)據(jù)量增長勢頭兇猛,而且越來越多種類終端產品接入,數(shù)據(jù)形態(tài)日趨多元化,非結構化難處理的數(shù)據(jù)占比增加,在數(shù)據(jù)處理中,人工智能算法作用越來越大,互聯(lián)網廠商對人工智能加速芯片的需求也越來越多,人工智能對算力的要求越來越高。在發(fā)布會上,清華大學教授尹首一就表示,人工智能算力需求每3.4月翻一番,遠超摩爾定律。
要滿足人工智能應用對算力需求,就離不開芯片。根據(jù)賽迪顧問的推算,2019至2021年間我國人工智能芯片平均年增速可超過50%,市場規(guī)模在2021年約為300億元左右,其中云端訓練芯片市場規(guī)模約為139億元,云端推理芯片市場規(guī)模約為82億元,而終端推理芯片約為84億元,各細分市場均需求旺盛,而在云端訓練芯片市場上,當前仍由英特爾、英偉達和賽靈思等外資廠商占絕對主導地位,國產替代空間廣闊。
尹首一認為,想做好人工智能芯片,要解決三個問題。首先是芯片本身的延展性,因為算法在不斷演進,人工智能系統(tǒng)在不斷變化,所以人工智能芯片要有一定可編程性;其次是算法包容性,神經網絡只是人工智能應用的一個分支,還有眾多傳統(tǒng)算法在人工智能應用中發(fā)揮著重要作用,所以人工智能芯片要具備覆蓋不同類型計算任務的能力;第三是能效比,從數(shù)據(jù)中心、云計算到邊緣物聯(lián)網設備,能效問題始終是芯片面臨的最大挑戰(zhàn)。
針對這些挑戰(zhàn),燧原科技此次宣布的“燧原產品定理”在一定程度上給出了解決路徑:在“平均業(yè)務”中,燧原每一代產品必須比前一代能效比提升三倍,性價比提升兩倍,并且軟件向后兼容可靠。燧原科技COO張亞林公布了云端訓練產品路線圖,計劃2023年推出的第三代加速卡和計算集群產品,其能效比將是初代產品的14倍。
具體來看,燧原科技本次發(fā)布的邃思2.0與上代產品同樣采用格芯12納米工藝,利用立體封裝技術整合9顆裸芯片,單精度32位浮點數(shù)算力達40 TFLOPS,比邃思1.0單精度算力提升一倍。邃思2.0對張量計算進行了大幅優(yōu)化,單精度張量TF32峰值算力達到160 TFLOPS。此外,邃思2.0也支持半精度16位浮點運算(峰值算力160TFLOPS)以及8位整數(shù)精度(峰值算力320TOPS)等多種數(shù)據(jù)格式運算。性能已經優(yōu)于國際領先廠商的次旗艦產品,與旗艦產品相比也是互有勝負。

左:燧原科技CEO趙立東
右:燧原科技COO張亞林
對于云端訓練等應用,芯片做出來只是第一步,如何用起來才更重要,為幫助客戶用得好,燧原科技為用戶提供了計算加速卡、服務器和完整的軟件開發(fā)環(huán)境與支持包等產品。
云燧T20和云燧T21是基于邃思2.0打造的兩款AI訓練加速板卡,邃思2.0的參數(shù)即由云燧T21板卡測試得出。在本次推出的服務器產品云燧智算集群CloudBlazer Matrix 2.0中,最高支持8192張云燧訓練卡級聯(lián),從而實現(xiàn)最高1.3E(130000T)單精度浮點運算的算力。
馭算TopsRider是燧原科技自主知識產權的計算及編程平臺,通過軟硬件協(xié)同架構設計,充分發(fā)揮邃思2.0的性能;基于算子泛化技術及圖優(yōu)化策略,支持主流深度學習框架下的各類模型訓練;利用Horovod分布式訓練框架與GCU-LARE互聯(lián)技術相互配合,為超大規(guī)模集群的高效運行提供解決方案。開放升級的編程模型和可擴展的算子接口,為客戶模型的優(yōu)化提供了自定義的開發(fā)能力。
在發(fā)布會上,燧原科技CEO趙立東宣布建設異構計算生態(tài)的“燎原”計劃,目標是以人功能為起點構建通用異構計算生態(tài),構建標準化技術體系,共建完整生態(tài)服務數(shù)字中國。

在當日的產品發(fā)布會上,多位專家學者和投資人都提到了生態(tài)建設的重要性。以個人電腦市場為例,我國前后幾十年的投入,信創(chuàng)市場仍然不能說達到了自主可控好用的預期目標,只有芯片沒有建設好應用生態(tài)就是一個教訓——當然也有芯片性能難以滿足市場化推廣要求的原因。
投資方代表武岳峰資本創(chuàng)始合伙人武平就表示,把生態(tài)搭建好,芯片才能用得好。中國有全世界領先的互聯(lián)網生態(tài),但在芯片產業(yè)上還比較幼稚,最近不少國內廠商宣布進入高難度大芯片領域,但像燧原科技這樣能說到做到的企業(yè)還不多。如果全產業(yè)上下游通力合作,給予中國芯片更多試錯空間,將來數(shù)據(jù)中心終將用上以燧原科技為代表的中國芯主芯片。