AI芯片將持續(xù)火熱 但什么時(shí)候能出現(xiàn)“爆款”還未可知
在剛剛過(guò)去的2019年,國(guó)內(nèi)外產(chǎn)業(yè)玩家們共同推動(dòng)著AI芯片的車輪向前滾動(dòng)。7nm芯片還未全面鋪開(kāi),5nm沖鋒的號(hào)角已經(jīng)吹響,在AI強(qiáng)勢(shì)侵入并顛覆各個(gè)傳統(tǒng)領(lǐng)域的同時(shí),AI芯片的架構(gòu)創(chuàng)新持續(xù)發(fā)酵?!癆I芯片”這個(gè)新鮮的概念在過(guò)去一年間逐漸走過(guò)了普及的階段,越來(lái)越被大眾所熟知。在行業(yè)走過(guò)野蠻生長(zhǎng),開(kāi)始加速落地、加速整合的過(guò)程中,也有更多的AI芯片公司也開(kāi)始走出屬于自己的差異化路線。
如今,AI芯片正在云計(jì)算、手機(jī)、安防監(jiān)控、智能家居、自動(dòng)駕駛五大場(chǎng)景上演新的群雄爭(zhēng)霸賽,包括華為、阿里、百度等巨頭企業(yè),均拿出自己的“殺手锏”。這些“殺手锏”在不同程度上提振了自己在行業(yè)的影響力,也給產(chǎn)業(yè)帶來(lái)巨大變革,更讓業(yè)界看到了中國(guó)半導(dǎo)體行業(yè)的希望。但是,在經(jīng)歷了一次次瘋狂打call之后,每次都覺(jué)得差了點(diǎn)什么——那種感覺(jué)仿佛就是看了一晚上網(wǎng)紅帶貨,但是當(dāng)主播大喊“買它!”之后,卻無(wú)人下單的尷尬。
可以說(shuō),盡管去年各大廠商紛紛推出了多款產(chǎn)品,但至今仍然沒(méi)有任何一款產(chǎn)品可以稱得上“現(xiàn)象級(jí)爆款”。為什么出現(xiàn)了此種叫好不叫買的情況?不由讓筆者深感疑惑。
究其原因不難發(fā)現(xiàn),覆蓋細(xì)分領(lǐng)域,偏離主戰(zhàn)場(chǎng)是其中的重要問(wèn)題。相關(guān)調(diào)研公司數(shù)據(jù)顯示,到2022年,整體AI芯片市場(chǎng)規(guī)模將會(huì)達(dá)到596.2億美元,其中云端訓(xùn)練+云端推斷芯片達(dá)到244億美元,占據(jù)四成以上的市場(chǎng)規(guī)模。毫無(wú)疑問(wèn),云端服務(wù)器市場(chǎng)是AI芯片的主戰(zhàn)場(chǎng)。目前的現(xiàn)狀是具備通用性優(yōu)勢(shì)的GPGPU占據(jù)了云端人工智能主導(dǎo)市場(chǎng),以TPU為代表的ASIC目前只運(yùn)用在巨頭的閉環(huán)生態(tài),FPGA在數(shù)據(jù)中心業(yè)務(wù)中還在嘗試階段。目前全球各大公司云計(jì)算中心如谷歌、微軟、亞馬遜、阿里巴巴等主流公司均采用GPU進(jìn)行AI計(jì)算。英偉達(dá)就是在這里賺的缽滿盆滿。目前,全球主流的硬件平臺(tái)都在使用英偉達(dá)的 GPU 進(jìn)行加速,AMD 也在積極參與。亞馬遜網(wǎng)絡(luò)服務(wù) AWS EC2、Google Cloud Engine(GCE)、IBM Softlayer、Hetzner、Paperspace 、LeaderGPU、阿里云、平安云等計(jì)算平臺(tái)都使用了英偉達(dá)的 GPU 產(chǎn)品提供深度學(xué)習(xí)算法訓(xùn)練服務(wù)。
反觀其他專用AI芯片廠商,在各自聚焦的細(xì)分領(lǐng)域都表現(xiàn)搶眼,但難以粉飾自身配角的地位。賽迪顧問(wèn)的預(yù)測(cè)數(shù)據(jù)顯示,2019年中國(guó)對(duì)于AI芯片需求最大的市場(chǎng)依次為安防、零售、醫(yī)療、教育、金融、制造、交通、物流等行業(yè)。其中最大的安防市場(chǎng)也僅占20%,多家聚焦安防領(lǐng)域的AI芯片廠商在經(jīng)歷了奮力廝殺后,也難以在出貨量等方面取得好成績(jī)。
而深究下去,聚焦單一領(lǐng)域又誘發(fā)了另一問(wèn)題:成本問(wèn)題。隨著芯片制造工藝的日益先進(jìn),芯片制造成本也水漲船高,如今設(shè)計(jì)制造一顆10nm芯片的成本要幾千萬(wàn)美元,綜合成本高達(dá)上億美元。因此,如果不能保證某款單一應(yīng)用場(chǎng)景下能夠大量出貨,專用芯片需要保持一定的通用性與靈活度。
最近兩年間,產(chǎn)業(yè)界開(kāi)始陸續(xù)涌現(xiàn)出神經(jīng)網(wǎng)絡(luò)計(jì)算專用芯片(AI芯片),寒武紀(jì)、深鑒科技、中星微電子等玩家的AI芯片產(chǎn)品采用的都是28nm的芯片工藝,前期從投入到流片的成本超過(guò)400萬(wàn)美元,單一品類出貨量沒(méi)有百萬(wàn)的級(jí)別將很難收回成本。
而除了成本之外,AI算法的演進(jìn)也需要納入考慮。由于目前人工智能算法還在不斷變化、不斷演進(jìn)的過(guò)程中,人工智能經(jīng)歷了六十多年的發(fā)展才迎來(lái)了深度學(xué)習(xí)的大規(guī)模爆發(fā),然而現(xiàn)在深度學(xué)習(xí)算法還有眾多有待優(yōu)化的方面,比如稀疏化、低功耗、小數(shù)據(jù)訓(xùn)練等,算法尚未定型。
此外,目前語(yǔ)音/文字/圖像/視頻等不同應(yīng)用無(wú)法使用統(tǒng)一算法,然而許多實(shí)際生活中的AI應(yīng)用程序(識(shí)別圖像中的對(duì)象或理解人類語(yǔ)言)需要不同類型的具有不同層數(shù)的神經(jīng)網(wǎng)絡(luò)的組合。
因此,在確保AI應(yīng)用性能的前提下,AI芯片需要盡可能地保持芯片通用性。那么問(wèn)題來(lái)了:既然GPGPU如此強(qiáng)大,能夠大小“通吃”,為什么廠商反而顧左右而言他?其實(shí)真正的困難在于GPGPU的技術(shù)難度。
硬件角度看,最核心的是指令集。指令集的覆蓋面、顆粒度、效率等決定一款芯片能否覆蓋到足夠?qū)挼膽?yīng)用市場(chǎng)領(lǐng)域,并對(duì)軟件開(kāi)發(fā)和產(chǎn)品迭代足夠友好。無(wú)論是英偉達(dá)還是AMD的GPGPU,指令集都在千條量級(jí),而目前國(guó)內(nèi)的AI芯片指令集大多數(shù)都在百條以內(nèi)。類型與數(shù)量的差別映射到硬件高效實(shí)現(xiàn)的復(fù)雜程度,差距是巨大的,在這方面國(guó)內(nèi)的團(tuán)隊(duì)還存在著一定的差距。另一個(gè)重要方面就是基于硬件層的任務(wù)管理和智能調(diào)度,這可以讓芯片從硬件層即提高算力的利用率,也就是大家常說(shuō)的實(shí)際算力。大多數(shù)AI芯片的做法是完全依賴于軟件層的調(diào)度實(shí)現(xiàn),但這種方式第一增加了軟件開(kāi)發(fā)的復(fù)雜度,第二降低了硬件算力的利用率,第三減緩了軟件棧迭代更新的速度,這在AI領(lǐng)域,面向算法模型、開(kāi)發(fā)環(huán)境、應(yīng)用場(chǎng)景加速更新的大背景下無(wú)疑大大增加了產(chǎn)品落地與工程化的難度。
在軟件方面,毫無(wú)疑問(wèn),最重要的必然是開(kāi)發(fā)生態(tài),GPGPU通過(guò)英偉達(dá)十多年的耕耘,已經(jīng)建立起了一個(gè)超過(guò)160萬(wàn)開(kāi)發(fā)用戶的龐大而成熟的生態(tài)-CUDA。AI芯片則需要搭建全新的生態(tài),它會(huì)帶來(lái)兩個(gè)維度顯著的問(wèn)題,第一個(gè)維度是客戶端,客戶需要冗長(zhǎng)的適配期,從原有的開(kāi)發(fā)環(huán)境切換到新的軟件生態(tài),這不僅帶來(lái)了資源投入,推遲了業(yè)務(wù)部署時(shí)間窗口,增加了業(yè)務(wù)的不確定性,更嚴(yán)重的是不利于保護(hù)已有的軟件投資,軟件的很多部分都要重新來(lái)寫并適配,這對(duì)企業(yè)級(jí)用戶來(lái)講恰恰是非常敏感與慎重的事情。另一個(gè)維度是產(chǎn)品開(kāi)發(fā)端,從底層芯片與系統(tǒng)軟件,跳過(guò)CUDA層去直接支持開(kāi)發(fā)框架,必然帶來(lái)巨大的軟件投入,不停得追趕現(xiàn)有框架的新版本,以及生態(tài)巨頭的新框架,這在底層軟件人員缺乏的背景下矛盾顯得尤其突出。
本文在一開(kāi)頭就提出了一個(gè)貌似針對(duì)產(chǎn)品的問(wèn)題,而事實(shí)上,這還是一個(gè)關(guān)于市場(chǎng)的問(wèn)題。能否成為爆款,一方面要看產(chǎn)品,另一方面還需要看市場(chǎng)需求。數(shù)據(jù)顯示,2018年中國(guó)AI芯片市場(chǎng)依然保持增長(zhǎng),整體市場(chǎng)規(guī)模達(dá)到80.8億元,同比增長(zhǎng)50.2%。且目前依然以云端訓(xùn)練芯片為主。2018年中國(guó)云端訓(xùn)練芯片市場(chǎng)份額達(dá)到51.3%。巨大的市場(chǎng)前景,也引來(lái)各方諸侯前來(lái)?yè)寠Z。
除了一騎絕塵的英偉達(dá),其他老牌的芯片巨頭都沒(méi)閑著,特別是Intel也在加緊布局通用GPU。英特爾眼饞GPU路人皆知,其背后是一段辛酸史——從開(kāi)始對(duì)GPU的不屑,到基于自家的x86架構(gòu)開(kāi)發(fā)獨(dú)立顯卡,英特爾折騰了十年之久仍然沒(méi)做出來(lái)一款像樣的GPU。近兩年傳出消息英特爾將在今年推出首款獨(dú)立GPU,這恐怕要得益于英特爾的重金挖人——原AMD RTG顯卡部門負(fù)責(zé)人Raja、Zen架構(gòu)的功勛領(lǐng)袖Jim Keller、顯卡技術(shù)市場(chǎng)總監(jiān)Damien Triolet這幾位大神都在2018年被英特爾招入麾下。
而在國(guó)內(nèi),一家名為“天數(shù)智芯”的公司也宣布將在今年發(fā)布GPGPU芯片。這家公司目前圍繞GPGPU的系統(tǒng)研發(fā)已聚集了一支百余人的技術(shù)團(tuán)隊(duì),其中不乏AMD在美國(guó)和上海做 GPU的核心團(tuán)隊(duì)成員、行業(yè)經(jīng)驗(yàn)超20年的世界級(jí)技術(shù)專家。
從產(chǎn)業(yè)發(fā)展規(guī)律來(lái)看,在過(guò)去兩年之內(nèi)AI芯片將持續(xù)火熱,大家扎堆進(jìn)入;但是到了2020年前后,則將會(huì)出現(xiàn)一批出局者,行業(yè)洗牌開(kāi)始。由于目前AI算法還在不斷演進(jìn)匯總的過(guò)程中,最終的成功與否則將取決于各家技術(shù)路徑的選擇和產(chǎn)品落地的速度。讓我們靜待2020年的第一個(gè)“爆款”早日來(lái)臨。