寒武紀(jì),即深度學(xué)習(xí)處理器,它是給電腦創(chuàng)造出模仿人類大腦多層大規(guī)模人工神經(jīng)網(wǎng)絡(luò)的芯片。在深度學(xué)習(xí)處理器的運(yùn)行當(dāng)中,計(jì)算系統(tǒng)的運(yùn)算能力提升是決定深度學(xué)習(xí)處理效率的關(guān)鍵。深度學(xué)習(xí)是指多層的人工神經(jīng)網(wǎng)絡(luò)和訓(xùn)練它的方法。通俗講就是指計(jì)算機(jī)通過深度神經(jīng)網(wǎng)絡(luò),模擬人腦的機(jī)制來學(xué)習(xí)、判斷、決策。2017年11月7日,中國科學(xué)院在北京發(fā)布了全球新一代人工智能芯片“寒武紀(jì)”系列——分別是3款面向智能手機(jī)等終端的“寒武紀(jì)”處理器IP,兩款面向服務(wù)器等云端的“寒武紀(jì)”高性能智能處理器,以及1款專門為開發(fā)者打造的人工智能軟件平臺(tái)。“寒武紀(jì)”是中國科學(xué)院計(jì)算技術(shù)研究所發(fā)布的全球首個(gè)能夠“深度學(xué)習(xí)”的“神經(jīng)網(wǎng)絡(luò)”處理器芯片。
最近,寒武紀(jì)的水花有點(diǎn)大。先是發(fā)布三季度財(cái)報(bào),前三季度營收2.22億元,同比增長(zhǎng)41.19%。緊接著,寒武紀(jì)馬上發(fā)布了國內(nèi)第一款公開發(fā)布支持LPDDR5內(nèi)存的云端AI芯片思元370,以及基于思元370的兩款加速卡。用此前寒武紀(jì)創(chuàng)始人陳天石接受媒體采訪時(shí)的話來說,就是,“我能做的只是做該做的事,走該走的路,把精力都放在產(chǎn)品研發(fā)和服務(wù)客戶上??嘈墓略勈浅晒Φ谋赜芍贰!倍以陉愄焓磥恚浼o(jì)已經(jīng)經(jīng)過了驗(yàn)證自己能做,拿出量產(chǎn)芯片,到了拼軟件、造生態(tài)的階段,而這個(gè)階段,也正是當(dāng)下英偉達(dá)等巨頭扎堆的領(lǐng)域。
寒武紀(jì)此次發(fā)布了推訓(xùn)一體思元370芯片,再加上此前發(fā)布的云端推理思元270、邊緣推理思元220、云端訓(xùn)練思元290,寒武紀(jì)為用戶提供了覆蓋不同場(chǎng)景、不同算力規(guī)模的全系列產(chǎn)品。思元370 是寒武紀(jì)首款采用chiplet(芯粒)技術(shù)的AI 芯片?;谂_(tái)積電7nm 制程工藝,最大算力達(dá)到256TOPS(INT8),這一數(shù)據(jù)是寒武紀(jì)第二代產(chǎn)品思元270 算力的2 倍。
縱觀2016年3月成立到2021年11月的五年間里,寒武紀(jì)每年至少推出一款智能芯片產(chǎn)品,按發(fā)布時(shí)間看,寒武紀(jì)1A(2016)、1H(2017)、1M(2018)、思元100(2018)、思元270(2019)、思元220(2019)、思元290(2020)、思元370(2021年)。公司成立僅僅5年,寒武紀(jì)科技就已擁有8個(gè)智能芯片產(chǎn)品,并實(shí)現(xiàn)了四次處理器架構(gòu)的迭代。
比如最新的第四代智能處理器架構(gòu)MLUarch03,擁有新一代張量運(yùn)算單元,內(nèi)置Supercharger模塊大幅提升各類卷積效率;采用全新的多算子硬件融合技術(shù),在軟件融合的基礎(chǔ)上大幅減少算子執(zhí)行時(shí)間;片上通訊帶寬是上一代MLUarch02的2倍、片上共享緩存容量最高是MLUarch02的2.75倍。配合最新架構(gòu),寒武紀(jì)還推出全新MLUv03指令集,更完備,更高效且向前兼容。
在這個(gè)愈發(fā)重視AI芯片自主架構(gòu)、能擁有“殺手級(jí)”應(yīng)用場(chǎng)景、能實(shí)現(xiàn)算力突破與能耗雙控的時(shí)代,思元370其實(shí)具有多項(xiàng)領(lǐng)先優(yōu)勢(shì):
在架構(gòu)上,思元370屬于寒武紀(jì)第四代自研智能芯片架構(gòu),第一代架構(gòu)MLUarch00主打智能加速IP核,第二代MLUarch01主打多核架構(gòu),第三代MLUarch02主打多核共享片內(nèi)存儲(chǔ),第四代MLUarch03更是寒武紀(jì)首款采用 chiplet(芯粒)技術(shù)的AI芯片,在國內(nèi)應(yīng)該也屬于行業(yè)首顆chiplet AI芯片。
在應(yīng)用場(chǎng)景靈活性上,由于思元370在一顆芯片中封裝2顆AI計(jì)算芯粒(MLU-Die),每一個(gè)MLU-Die都具備獨(dú)立的AI計(jì)算單元、內(nèi)存、IO以及MLU-Fabric控制和接口,不同MLU-Die可以組合規(guī)格多樣化的產(chǎn)品,為用戶提供適用不同場(chǎng)景的高性價(jià)比AI芯片。
在算力上,基于臺(tái)積電 7nm 制程工藝、整體集成390億個(gè)晶體管的思元370最大算力達(dá)到 256TOPS(INT8),相比上一代思元270算力直接翻倍。
不到18個(gè)月就實(shí)現(xiàn)了算力翻倍,在通用處理器領(lǐng)域已經(jīng)失效的摩爾定律,在AI芯片領(lǐng)域還在延續(xù)。
現(xiàn)實(shí)世界對(duì)于算力的需求遠(yuǎn)沒有到達(dá)頂峰。以英偉達(dá)為例,自2017年底英偉達(dá)發(fā)布Tesla V100之后,訓(xùn)練最大模型的算力需求增長(zhǎng)了3000倍。
舉例來說,僅是分析3000萬路視頻,以常見的英偉達(dá)Tesla P4顯卡為例約需100萬塊,總硬件成本200億元以上,一塊顯卡按照75瓦起步功耗計(jì)算總功耗也高達(dá)7.5萬千瓦。
作為全球智能芯片領(lǐng)域的先行者,寒武紀(jì)聚焦端云一體、端云融合的智能新生態(tài),致力打造各類智能云服務(wù)器、智能終端以及智能機(jī)器人的核心處理器芯片。
寒武紀(jì)智能處理器架構(gòu)MLUarch03,擁有新一代張量運(yùn)算單元,內(nèi)置Supercharger模塊大幅提升各類卷積效率;采用全新的多算子硬件融合技術(shù),在軟件融合的基礎(chǔ)上大幅減少算子執(zhí)行時(shí)間;片上通訊帶寬是上一代MLUarch02的2倍、片上共享緩存容量最高是MLUarch02的2.75倍;推出全新MLUv03指令集,更完備,更高效且向前兼容。
有7nm先進(jìn)工藝和全新MLUarch03架構(gòu)的加持,思元370芯片算力最高可達(dá)256TOPS(INT8),是上一代產(chǎn)品思元270算力的2倍。相較于峰值算力的提升,思元370在實(shí)測(cè)性能和能效方面的表現(xiàn)更為優(yōu)秀:以ResNet-50為例,MLU370-S4加速卡(半高半長(zhǎng))實(shí)測(cè)性能為同尺寸主流GPU的2倍;MLU370-X4加速卡(全高全長(zhǎng))實(shí)測(cè)性能與同尺寸主流GPU相當(dāng),能效則大幅領(lǐng)先。
MagicMind是寒武紀(jì)全新打造的推理加速引擎,也是業(yè)界首個(gè)基于MLIR圖編譯技術(shù)達(dá)到商業(yè)化部署能力的推理引擎。MagicMind支持跨框架的模型解析、自動(dòng)后端代碼生成及優(yōu)化。在MLU、GPU、CPU訓(xùn)練好的算法模型上,借助MagicMind,用戶僅需投入極少的開發(fā)成本,即可將推理業(yè)務(wù)部署到寒武紀(jì)全系列產(chǎn)品上,并獲得頗具競(jìng)爭(zhēng)力的性能。
MagicMind的優(yōu)勢(shì)不僅在于可以提供極致的性能、可靠的精度以及簡(jiǎn)潔的編程接口,讓用戶能夠?qū)W⒂跇I(yè)務(wù)本身,無需理解芯片更多底層細(xì)節(jié)就可實(shí)現(xiàn)模型的快速高效部署,MagicMind插件化的設(shè)計(jì)還可以滿足在性能或功能上追求差異化競(jìng)爭(zhēng)力的客戶需求。
除了“云邊端”之外,寒武紀(jì)也開始涉足汽車市場(chǎng)。在今年 7 月舉辦的 2021 世界人工智能大會(huì)上,寒武紀(jì)首次披露了控股子公司行歌科技的進(jìn)展,并披露研發(fā)中的車載智能芯片關(guān)鍵數(shù)據(jù)——基于 7 納米制程的車規(guī)級(jí)芯片,算力大于200TOPS,具備獨(dú)立安全島及成熟軟件工具鏈。
寒武紀(jì)的“云邊端車”處理器都是用統(tǒng)一的處理器架構(gòu)和基礎(chǔ)軟件平臺(tái),這意味著開發(fā)者只要在某一端應(yīng)用寒武紀(jì)的產(chǎn)品,其他端很容易就能實(shí)現(xiàn)互相兼容,大大減少不同平臺(tái)的開發(fā)和應(yīng)用遷移成本。據(jù)了解,市面上具有“云邊端車”生態(tài)協(xié)同優(yōu)勢(shì)的玩家,其實(shí)只有兩三家,寒武紀(jì)正是其中之一。
進(jìn)入2020年,寒武紀(jì)營收增長(zhǎng)幅度大幅減緩,營收4.59億元,同比增長(zhǎng)3.38%;歸母凈虧損4.36億元。2021年一季度,雖然營收增幅213%,但歸母凈虧損從去年的1.08億元擴(kuò)大至2.06億元。由此計(jì)算,寒武紀(jì)2017年以來歸母凈虧損累計(jì)超過22億元。
國金證券研報(bào)分析稱,寒武紀(jì)2021年一季度短期虧損擴(kuò)大,市場(chǎng)預(yù)期過于樂觀:營收僅占Wind分析師全年預(yù)期的4個(gè)點(diǎn),虧損卻超過Wind全年預(yù)期的50%,主要?dú)w因于研發(fā)及管理費(fèi)用(增加股票激勵(lì))同比大幅增加所致。
根據(jù)Wind分析師預(yù)期寒武紀(jì)2021年?duì)I收增長(zhǎng)93%達(dá)8.88億,虧損為3.85億。國金證券初步認(rèn)為寒武紀(jì)達(dá)成今年?duì)I收預(yù)期及減少虧損有難度。
國金證券表示,寒武紀(jì)費(fèi)用增加短期扭虧不易。隨著寒武紀(jì)持續(xù)加大云邊端產(chǎn)品線及軟件開發(fā)平臺(tái)的研發(fā)投入,研發(fā)費(fèi)用較去年有較大幅度的增加,國金證券維持之前對(duì)寒武紀(jì)的看法,短期扭虧為盈不容易,自由現(xiàn)金流持續(xù)惡化。
此前,寒武紀(jì)的技術(shù)沉淀讓它搶得了先機(jī),政策利好一度助力公司市值超過千億元。但是在構(gòu)建生態(tài)方面公司并不具備必然優(yōu)勢(shì)。作為最早投身行業(yè)的AI芯片第一股,寒武紀(jì)要如何應(yīng)對(duì)巨頭的競(jìng)爭(zhēng)?還有哪些新的業(yè)務(wù)拓展可能性?何時(shí)能夠扭虧為盈?這些都是投資者們?cè)趯徱暫秃饬窟@家公司時(shí)會(huì)思考的重要問題。
在下個(gè)階段,擺脫了一級(jí)市場(chǎng)光環(huán)的寒武紀(jì),要想提振二級(jí)市場(chǎng)投資者們的信心,恐怕需要交出更多的利好答卷。