寒武紀(jì)1A處理器可跟蘋(píng)果產(chǎn)品一較高下 保留“火種”是關(guān)鍵
人工智能就是一場(chǎng)生死搏殺,各大巨頭入局千億市場(chǎng)再一戰(zhàn)勝負(fù)。寒武紀(jì)背靠中科院踏入了“獨(dú)角獸”領(lǐng)域。芯片的成敗,除了本身的效率之外,生態(tài)是非常關(guān)鍵的環(huán)節(jié)。陳天石認(rèn)為,寒武紀(jì)1A處理器,可以跟蘋(píng)果產(chǎn)品一較高下。
有一句話形容現(xiàn)在的人工智能特別合適:“我們往往高估了目前,而低估了未來(lái)”。如果要以其提出到現(xiàn)在60余年為一個(gè)周期來(lái)看,它真正席卷人類社會(huì),才剛剛開(kāi)始。
從這樣的歷史長(zhǎng)河來(lái)看、從通用人工智能的未來(lái)回溯看,這個(gè)時(shí)代占據(jù)舞臺(tái)中央的這些開(kāi)拓者,都是手握著“深度學(xué)習(xí)”、“神經(jīng)網(wǎng)絡(luò)”等最原始的工具,在這塊荒野上蹣跚前行。走在尋找人工智能基礎(chǔ)工具這條路上,陳天石不比其他人多什么先決條件。
幸運(yùn)的是,從他創(chuàng)造的石器中,人們逐漸發(fā)現(xiàn)并保留了火種。
寒武紀(jì),這家背靠中科院計(jì)算所的創(chuàng)業(yè)公司剛亮相市場(chǎng),就踏入了“獨(dú)角獸”領(lǐng)域。
打磨“石器”
AI是一場(chǎng)革命。它和互聯(lián)網(wǎng)一樣,會(huì)席卷一切,會(huì)從無(wú)到有、再?gòu)挠械綗o(wú)(無(wú)處不在)。普通人甚至不需要前行,它會(huì)主動(dòng)過(guò)來(lái)?yè)肀?,甚至裹挾你。用羅振宇的話說(shuō):“你不必著急出發(fā),因?yàn)槟憬K將被抵達(dá)”。
在這場(chǎng)基礎(chǔ)設(shè)施重新定義的革命中,陳天石無(wú)疑是一個(gè)提前出發(fā)者。16歲考入中國(guó)科學(xué)技術(shù)大學(xué)少年班;2014年論文在美國(guó)召開(kāi)的國(guó)際頂級(jí)學(xué)術(shù)會(huì)議上獲得最佳論文獎(jiǎng);創(chuàng)辦的公司寒武紀(jì)科技,A輪估值超過(guò)10億美元,成為全球首個(gè)人工智能芯片“獨(dú)角獸”、全球最大的AI芯片初創(chuàng)公司。
基于深度學(xué)習(xí)這一底層算法,計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、自然語(yǔ)言處理、音頻識(shí)別與生物信息學(xué)等領(lǐng)域取得了長(zhǎng)足的進(jìn)展。但傳統(tǒng)的處理器例如CPU等,雖然是目前主流的AI計(jì)算平臺(tái),但是其基本框架結(jié)構(gòu)畢竟不是為了AI所設(shè)計(jì)的,效率受到很多限制,包括GPU也有耗電量大等缺陷。
如果要用通用處理器搭建一個(gè)人腦規(guī)模突觸的神經(jīng)網(wǎng)絡(luò),可能需要建一個(gè)電站來(lái)給它供電。阿爾法狗剛亮相時(shí),下一盤(pán)棋動(dòng)用了1000個(gè)CPU和200個(gè)GPU,每分鐘的電費(fèi)就高達(dá)300美元,而網(wǎng)絡(luò)規(guī)模只有人腦的千分之一。
陳天石認(rèn)為,理想中的AI芯片應(yīng)當(dāng)是一種新型的處理器,能具有廣闊的應(yīng)用面(包括語(yǔ)音、語(yǔ)義、圖像、視頻、自然語(yǔ)言多模態(tài)處理能力),同時(shí)具備遠(yuǎn)超CPU和GPU的效率。要想達(dá)到這一目標(biāo),必須要有一套新的AI指令集,利用指令進(jìn)行靈活處理,才有可能在AI芯片上把各種算法應(yīng)用都能支持得又快又好。
打個(gè)簡(jiǎn)單的比方,把摩托車(PC、手機(jī)等)的發(fā)動(dòng)機(jī)(CPU)裝到了汽車(深度學(xué)習(xí)平臺(tái))上,汽車自然開(kāi)不快;現(xiàn)在,需要為汽車專門設(shè)計(jì)一款發(fā)動(dòng)機(jī)(深度學(xué)習(xí)專用處理器)。
“DianNao”這一深度學(xué)習(xí)處理器架構(gòu),平均仿真性能超過(guò)主流CPU核的100倍,但是面積和功耗僅為1/10,效能提升可達(dá)三個(gè)數(shù)量級(jí)。2014年,他和哥哥陳云霽以及法國(guó)信息技術(shù)研究院(Inria)的Olivier Temam教授合作的這篇論文,成為頂尖國(guó)際會(huì)議的最佳論文。
2014年-2016年間,他們倆和國(guó)際學(xué)術(shù)合作者一道幾乎橫掃了處理器架構(gòu)學(xué)術(shù)圈,在頂級(jí)學(xué)術(shù)會(huì)議上教老外說(shuō)中文的Diannao系列:Diannao(電腦)、DaDiannao(大電腦)、PuDiannao(普電腦)、ShiDiannao(視電腦)、Cambricon(寒武紀(jì)指令集)等一系列創(chuàng)新,針對(duì)不同的目的,將目前深度學(xué)習(xí)的效率提高數(shù)百倍。
有院士這樣分析,“寒武紀(jì)”在深度學(xué)習(xí)處理器指令集上的開(kāi)創(chuàng)性進(jìn)展,為我國(guó)占據(jù)智能產(chǎn)業(yè)生態(tài)的領(lǐng)導(dǎo)性地位提供了技術(shù)支撐。自2014年中科院計(jì)算所和Inria聯(lián)合團(tuán)隊(duì)提出首個(gè)深度學(xué)習(xí)處理器架構(gòu)DianNao之后,深度學(xué)習(xí)處理器已經(jīng)成為計(jì)算機(jī)體系結(jié)構(gòu)國(guó)際會(huì)議ISCA最關(guān)注的研究方向之一。ISCA 2016上有近1/6的論文引用“寒武紀(jì)”的工作來(lái)進(jìn)行深度學(xué)習(xí)處理器探索。
“目前,像阿爾法狗這樣的軟件算法是在GPU上執(zhí)行的,將來(lái)如果使用了‘寒武紀(jì)’處理器,深度學(xué)習(xí)(神經(jīng)網(wǎng)絡(luò))的運(yùn)算速度會(huì)得到明顯提升。”陳天石說(shuō)。
他用“瑞士軍刀和菜刀”來(lái)比喻通用處理器和深度學(xué)習(xí)處理器的關(guān)系:瑞士軍刀雖然功能多,但是做菜的時(shí)候,還是菜刀更合適。在智能處理方面,“寒武紀(jì)”就是這把更合適的菜刀。
寒武紀(jì)指令集直接面對(duì)大規(guī)模神經(jīng)元和突觸的處理,一條指令即可完成一組神經(jīng)元的處理,并對(duì)神經(jīng)元和突觸數(shù)據(jù)在芯片上的傳輸提供了一系列專門的支持。模擬實(shí)驗(yàn)表明,采用寒武紀(jì)指令集的深度學(xué)習(xí)處理器相對(duì)于x86指令集的中央處理器有兩個(gè)數(shù)量級(jí)的性能提升。
如今,通過(guò)在計(jì)算機(jī)中模擬神經(jīng)元和突觸的計(jì)算,寒武紀(jì)的AI芯片對(duì)信息進(jìn)行智能處理,借助專門設(shè)計(jì)的存儲(chǔ)結(jié)構(gòu)和指令集,每秒可以處理160億個(gè)神經(jīng)元和超過(guò)2萬(wàn)億個(gè)突觸,功耗卻只有原來(lái)的十分之一,未來(lái)甚至有希望把類似阿爾法狗的系統(tǒng)裝進(jìn)手機(jī)。