寒武紀1A處理器可跟蘋果產(chǎn)品一較高下 保留“火種”是關(guān)鍵
人工智能就是一場生死搏殺,各大巨頭入局千億市場再一戰(zhàn)勝負。寒武紀背靠中科院踏入了“獨角獸”領域。芯片的成敗,除了本身的效率之外,生態(tài)是非常關(guān)鍵的環(huán)節(jié)。陳天石認為,寒武紀1A處理器,可以跟蘋果產(chǎn)品一較高下。
有一句話形容現(xiàn)在的人工智能特別合適:“我們往往高估了目前,而低估了未來”。如果要以其提出到現(xiàn)在60余年為一個周期來看,它真正席卷人類社會,才剛剛開始。
從這樣的歷史長河來看、從通用人工智能的未來回溯看,這個時代占據(jù)舞臺中央的這些開拓者,都是手握著“深度學習”、“神經(jīng)網(wǎng)絡”等最原始的工具,在這塊荒野上蹣跚前行。走在尋找人工智能基礎工具這條路上,陳天石不比其他人多什么先決條件。
幸運的是,從他創(chuàng)造的石器中,人們逐漸發(fā)現(xiàn)并保留了火種。
寒武紀,這家背靠中科院計算所的創(chuàng)業(yè)公司剛亮相市場,就踏入了“獨角獸”領域。
打磨“石器”
AI是一場革命。它和互聯(lián)網(wǎng)一樣,會席卷一切,會從無到有、再從有到無(無處不在)。普通人甚至不需要前行,它會主動過來擁抱你,甚至裹挾你。用羅振宇的話說:“你不必著急出發(fā),因為你終將被抵達”。
在這場基礎設施重新定義的革命中,陳天石無疑是一個提前出發(fā)者。16歲考入中國科學技術(shù)大學少年班;2014年論文在美國召開的國際頂級學術(shù)會議上獲得最佳論文獎;創(chuàng)辦的公司寒武紀科技,A輪估值超過10億美元,成為全球首個人工智能芯片“獨角獸”、全球最大的AI芯片初創(chuàng)公司。
基于深度學習這一底層算法,計算機視覺、語音識別、自然語言處理、音頻識別與生物信息學等領域取得了長足的進展。但傳統(tǒng)的處理器例如CPU等,雖然是目前主流的AI計算平臺,但是其基本框架結(jié)構(gòu)畢竟不是為了AI所設計的,效率受到很多限制,包括GPU也有耗電量大等缺陷。
如果要用通用處理器搭建一個人腦規(guī)模突觸的神經(jīng)網(wǎng)絡,可能需要建一個電站來給它供電。阿爾法狗剛亮相時,下一盤棋動用了1000個CPU和200個GPU,每分鐘的電費就高達300美元,而網(wǎng)絡規(guī)模只有人腦的千分之一。
陳天石認為,理想中的AI芯片應當是一種新型的處理器,能具有廣闊的應用面(包括語音、語義、圖像、視頻、自然語言多模態(tài)處理能力),同時具備遠超CPU和GPU的效率。要想達到這一目標,必須要有一套新的AI指令集,利用指令進行靈活處理,才有可能在AI芯片上把各種算法應用都能支持得又快又好。
打個簡單的比方,把摩托車(PC、手機等)的發(fā)動機(CPU)裝到了汽車(深度學習平臺)上,汽車自然開不快;現(xiàn)在,需要為汽車專門設計一款發(fā)動機(深度學習專用處理器)。
“DianNao”這一深度學習處理器架構(gòu),平均仿真性能超過主流CPU核的100倍,但是面積和功耗僅為1/10,效能提升可達三個數(shù)量級。2014年,他和哥哥陳云霽以及法國信息技術(shù)研究院(Inria)的Olivier Temam教授合作的這篇論文,成為頂尖國際會議的最佳論文。
2014年-2016年間,他們倆和國際學術(shù)合作者一道幾乎橫掃了處理器架構(gòu)學術(shù)圈,在頂級學術(shù)會議上教老外說中文的Diannao系列:Diannao(電腦)、DaDiannao(大電腦)、PuDiannao(普電腦)、ShiDiannao(視電腦)、Cambricon(寒武紀指令集)等一系列創(chuàng)新,針對不同的目的,將目前深度學習的效率提高數(shù)百倍。
有院士這樣分析,“寒武紀”在深度學習處理器指令集上的開創(chuàng)性進展,為我國占據(jù)智能產(chǎn)業(yè)生態(tài)的領導性地位提供了技術(shù)支撐。自2014年中科院計算所和Inria聯(lián)合團隊提出首個深度學習處理器架構(gòu)DianNao之后,深度學習處理器已經(jīng)成為計算機體系結(jié)構(gòu)國際會議ISCA最關(guān)注的研究方向之一。ISCA 2016上有近1/6的論文引用“寒武紀”的工作來進行深度學習處理器探索。
“目前,像阿爾法狗這樣的軟件算法是在GPU上執(zhí)行的,將來如果使用了‘寒武紀’處理器,深度學習(神經(jīng)網(wǎng)絡)的運算速度會得到明顯提升。”陳天石說。
他用“瑞士軍刀和菜刀”來比喻通用處理器和深度學習處理器的關(guān)系:瑞士軍刀雖然功能多,但是做菜的時候,還是菜刀更合適。在智能處理方面,“寒武紀”就是這把更合適的菜刀。
寒武紀指令集直接面對大規(guī)模神經(jīng)元和突觸的處理,一條指令即可完成一組神經(jīng)元的處理,并對神經(jīng)元和突觸數(shù)據(jù)在芯片上的傳輸提供了一系列專門的支持。模擬實驗表明,采用寒武紀指令集的深度學習處理器相對于x86指令集的中央處理器有兩個數(shù)量級的性能提升。
如今,通過在計算機中模擬神經(jīng)元和突觸的計算,寒武紀的AI芯片對信息進行智能處理,借助專門設計的存儲結(jié)構(gòu)和指令集,每秒可以處理160億個神經(jīng)元和超過2萬億個突觸,功耗卻只有原來的十分之一,未來甚至有希望把類似阿爾法狗的系統(tǒng)裝進手機。