AI芯片的競爭才剛剛開始 2020年將是AI芯片落地正面較量的關鍵之年
上世紀80年代,英特爾曾身陷風雨飄搖的境地。
令人生畏的日企在存儲芯片領域勢如破竹,將英特爾等美國半導體公司逼至越投資越虧損的惡性循環(huán)。
英特爾最關鍵的轉(zhuǎn)型決定,甚至不是由英特爾所主導。大型機領導者IBM為了快速開辟個人電腦(PC)市場,在1981年向英特爾伸出橄欖枝——將PC微處理器訂單交給英特爾,推動英特爾將產(chǎn)品重心從存儲轉(zhuǎn)移到微處理器業(yè)務,躍居全球最大的半導體公司。
PC時代將機遇送到英特爾面前,而英特爾引以為傲的PC業(yè)務,卻成為阻礙它擁抱移動時代的枷鎖。
22年后,蘋果以iPhone掀起智能手機的狂瀾,引發(fā)移動芯片版圖的巨變。低耗電的Arm處理器開始雄赳赳的占據(jù)移動處理器市場,同時3G時代的到來讓高通逆襲成智能手機芯片之皇。
電子產(chǎn)品的演進屢屢引發(fā)芯片領域的巨變,芯片在科技和經(jīng)濟發(fā)展史中何其關鍵,誰能掌握核心技術和主流市場,誰就掌握了制衡生態(tài)的的話語權(quán)。
歷史的巧合不斷上演。伴隨著人工智能(AI)點燃新的藍海市場,芯片公司NVIDIA率先收割深度學習的紅利,叱咤PC和智能手機時代的半導體巨頭英特爾、高通和華為也在變革中站到了新的戰(zhàn)場,在不同的領地相遇、交戰(zhàn)。
▲ “云-邊-端”發(fā)展示意圖
我們復盤過去四年間,上述多家芯片巨頭分別如何花式跨界云、邊、端、汽車這些他們原本鮮少踏足的新戰(zhàn)場,以及在這股跨界風潮中,中國AI芯片市場正扮演的關鍵角色。
云端:高通看上的170億美元市場
1997年5月11日,IBM深藍計算機經(jīng)過六場角逐,以“兩勝一負三平”擊敗世界象棋冠軍加里·卡斯帕羅夫。這臺超級計算機重1270公斤,有32個微處理器,每秒可計算2億步棋。
19年后,谷歌AlphaGo以“4:1”比分戰(zhàn)勝世界圍棋冠軍李世石,將冷寂已久的人工智能再次推至人們視野的焦點。不同于深藍,將AlphaGo訓練出超人智商的幕后功臣,并未出現(xiàn)在現(xiàn)場。
兩場人機大戰(zhàn),計算速度的奧妙從硬件轉(zhuǎn)移至軟件。深藍是記憶大師,靠記住所有棋譜壓制對手,制勝之法是能承載起龐大計算的超強硬件算力。AlphaGo則是實戰(zhàn)派,通過每一場對弈來汲取經(jīng)驗,并且能創(chuàng)造新的棋局來進行自訓練,以遠少于窮舉的計算量,從一個圍棋小白錘煉成超越人類棋手的大師。
AlphaGo的算力王牌,彼時正隱藏在谷歌云的背后。
云計算打破傳統(tǒng)硬件資源的疆界,實現(xiàn)資源利用率最大化,為AI走向大規(guī)模商業(yè)化應用鋪下至為關鍵的磚瓦。
中國最大云計算廠商阿里巴巴的AI,每天被調(diào)用超過1萬億次,每日處理圖像10億張、處理視頻120萬小時、處理語音55萬小時、處理自然語言5000億句,服務全球超過10億人。
云計算數(shù)據(jù)中心也成為AI芯片起家的大本營。
根據(jù)賽迪顧問2019年8月發(fā)布的《中國人工智能芯片產(chǎn)業(yè)發(fā)展白皮書》,2018年全球AI芯片市場規(guī)模達45.3億美元(約317.1億人民幣)。其中,云端訓練芯片占比達49.5%,云端推理芯片占比達20.7%,終端推理芯片占比達29.8%。
▲云端和終端AI芯片市場規(guī)模增速
最有利可圖的云端市場,成就了NVIDIA的揚名立萬,指引了英特爾的轉(zhuǎn)型方向,同樣吸引了觀望已久的終端半導體巨頭高通。
2019年4月,高通發(fā)布挺進數(shù)據(jù)中心的預告片,披露7nm云端推理專用芯片Cloud AI 100,號稱峰值算力達350TOPS,比當時最先進的AI推理解決方案每瓦性能提升10倍以上,比高通驍龍?zhí)幚砥髌螦I計算能力提升50倍。
有趣的是,NVIDIA和英特爾這些云端大玩家走的都是通用路線,高通卻另辟蹊徑,選擇做專用芯片ASIC。
通用芯片雖在性能上或許略遜一籌,但它不像專用芯片那么“挑剔”,放在任意環(huán)境都能取得幾乎一致的效果。專用芯片則不然,它的電路被完全固化,或許在一種環(huán)境中效率高如“猛獸”,在另一種環(huán)境就變得十分雞肋。
做AI ASIC者往往分為兩種,一種如谷歌亞馬遜等云計算廠商供內(nèi)部使用,一種則專注于低端市場。和此前入局AI芯片的玩家做比較,高通此舉顯得有些新奇。
看起來,高通似乎為了實現(xiàn)性能更強大的AI芯片,放棄了對靈活性的追求。不過由于高通還未提供加速器的架構(gòu)細節(jié),也許他們在全新的架構(gòu)設計中已經(jīng)探索到一個平衡。
不同機構(gòu)對AI推理市場規(guī)模的預測差別很大,高通較認可的是到2025年,數(shù)據(jù)中心AI推理市場規(guī)模將達到170億美元,沒有企業(yè)不想多吞下一份大蛋糕。
在一次視頻訪談中,高通總裁Cristiano Amon預言到云端就是新的游戲平臺,這是Cloud AI 100的“完美應用場景”。
高通跨界的信心來自在移動芯片領域扎實的技術積累。作為智能手機芯片的佼佼者,它希望將其在終端推理的低功耗、信號處理技術、規(guī)模和成本優(yōu)勢,部分拓展到云端推理產(chǎn)品上,減輕移動終端AI處理的負荷。
數(shù)據(jù)中心的運營商們雖然很樂意去嘗試新處理器,但高通能否說服他們大規(guī)模應用Cloud AI 100,前路還是一片迷霧。
中國芯的種子選手,高通的老伙計
在太平洋的對岸,華為海思比高通提早半年展露了進軍云端芯片的雄心。
2018年10月,華為在全聯(lián)接大會上,首秀其全棧全場景AI解決方案的面貌,AI芯片品牌“昇騰”初露面就帶來了兩顆芯片,主打邊緣計算的昇騰310和主打云端訓練的昇騰910。
10個月后,昇騰910正式推出,號稱當時全球單芯片計算密度最大的AI芯片,峰值算力256TFLOPS,最大功耗350W。
海思半導體2004年成立,此前通過在智能移動終端芯片、視頻編解碼芯片、多媒體芯片、基帶芯片、物聯(lián)網(wǎng)芯片等終端領域的耕耘,已經(jīng)成長為中國第一大IC設計企業(yè)。
昇騰910是華為海思切入云端AI芯片市場的第一枚棋。
和高通Cloud AI 100顯示,昇騰910也采用世界領先的7nm制程工藝。但當高通的云端芯片還在醞釀之中,昇騰910已快速進入落地階段。
高通和華為海思都是旗艦手機芯片制造商中的佼佼者,憑借過硬的技術實力爭奪最強手機AI芯片和最強5G實力的殊榮。
不同的是,高通走通用路線,將手機SoC芯片銷售給全球有需求的企業(yè),華為也是它的客戶之一;海思則是華為的附屬品,跟著華為的主戰(zhàn)隊伍前進,自研手機芯片僅用在自己品牌的手機中。
在進入云端數(shù)據(jù)中心的策略上,華為顯得比高通更加豪放,直接放出自己在AI芯片研發(fā)上的整體藍圖,云端訓練、云端推理、邊緣計算、終端推理全盤覆蓋,而高通迄今為止僅透露出入局云端推理芯片的計劃。
不過,兩家在云端芯片的落地方向上卻似有殊途同歸之勢。
高通自不必多說,即便選擇研發(fā)ASIC芯片,大概率還是堅持通用方向,華為也開始向外部機構(gòu)提供集成了其云端AI芯片的集群。
今年9月,華為圍繞“鯤鵬+昇騰”雙引擎全面啟航計算戰(zhàn)略,并發(fā)布了由數(shù)千顆昇騰910組成的AI集群Atlas 900。這一集群不僅被用于助力國際組織SKA探索浩渺宇宙星空,也進入了深圳鵬程實驗室,作為其AI基礎性研究平臺鵬程云腦II的算力底座。
從高通和華為的摩拳擦掌,足見AI芯片市場對芯片廠商的吸引力。
邊緣與端側(cè):三大玩家神仙打架
如果說云計算和AI為云端AI芯片發(fā)展儲備了優(yōu)渥的土壤,那么AI、5G和物聯(lián)網(wǎng)則共同促成了邊緣和終端AI芯片的繁榮。
從終端用戶的角度,使用AI應用時,希望程序響應速度越快越好,同時也希望應用盡可能少受網(wǎng)絡限制,在離線環(huán)境下也能做部分計算處理。
從To B廠商的角度,隨著物聯(lián)網(wǎng)終端的快速擴張,數(shù)據(jù)爆炸式增長,網(wǎng)絡傳輸和數(shù)據(jù)中心都需要邊緣和終端側(cè)的計算來減輕壓力,節(jié)省開支。
云端AI芯片技術門檻高且巨頭云集,相對而言,邊緣和終端市場猶如一片未經(jīng)開墾的新地,半導體巨頭和創(chuàng)業(yè)新秀都在摩拳擦掌。
在邊緣加速推理領域,比較能打的有NVIDIA、英特爾和谷歌。
NVIDIA Jetson GPU系列在邊緣計算領域廣受歡迎,與其數(shù)據(jù)中心產(chǎn)品全面兼容,既有面向AI和IoT終端開發(fā)的Jetson Nano,也有適用于工業(yè)和機器人用例的Jetson TX2和Jetson Xavier。
Jetson由統(tǒng)一軟件堆棧JetPack提供支持,借助這一堆棧,開發(fā)者可輕松將TensorFlow和PyTorch模型轉(zhuǎn)換為TensorRT,進而優(yōu)化模型的準確性和速度。
英特爾在邊緣計算的旗艦產(chǎn)品是Movidius Myraid VPU(視覺處理單元)。除了應用在視頻監(jiān)控攝像頭中,英特爾還將Myriad VPU封裝在小巧的USB驅(qū)動器中,作為神經(jīng)計算棒對外出售,可以輕松插入英特爾NUC和樹莓派中加速推理。
英特爾打造的軟件平臺OpenVINO和NVIDIA JetPack類似,用于為Movidius VPU優(yōu)化計算機視覺模型。
谷歌邊緣推理芯片Edge TPU,以和云端的TPU互為補充。谷歌在打造一個自動化和簡化從云端訓練到部署在Edge TPU上全工作流程的無縫管道。谷歌也基于Edge TPU做了Coral Dev Board開發(fā)板和類似Movidius神經(jīng)計算棒的Coral USB加速器。
不過Edge TPU沒有Jetson和Movidius VPU兼容性那么強,它是專為谷歌在邊緣運行的TensorFlow Lite模型而設計,只支持TensorFlow框架。
盡管這些邊緣芯片在性能上無法與云端數(shù)據(jù)中心運行的芯片相提并論,但他們正以更高性能、更低功耗、更快響應時間,彌合數(shù)據(jù)中心和邊緣設備之間的鴻溝,并幫助企業(yè)節(jié)省帶寬和云存儲成本。
自動駕駛:兩強爭霸與劍走偏鋒
邊緣計算同樣被稱為自動駕駛的未來。
據(jù)Gartner預測,到2021年,全球自動駕駛車輛所用芯片的年收入將增加一倍以上,市場規(guī)模將達到50億美元。
有趣的是,自動駕駛芯片的領跑者并非恩智浦、英飛凌等傳統(tǒng)汽車半導體巨頭,而是“半道插隊”的NVIDIA和英特爾。
2017年1月,NVIDIA第一次對外展示其自動駕駛產(chǎn)品線Drive PX中最高階的AI超級計算機Drive Xavier,亮出其自動駕駛最強招牌。
同年3月,英特爾花153億美元高價收購以色列計算機視覺公司Mobileye,兩年后,Mobileye已成為英特爾增長速度最快的業(yè)務部門。
兩個自動駕駛芯片TOP級玩家的“相愛相殺”就此拉開序幕,目標市場一致,細分打法卻略有不同。
NVIDIA的自動駕駛平臺希望幫助汽車在做出決策前,借由其強大的計算能力預先考慮所有的可能,主要發(fā)揮超強硬件計算速度的優(yōu)勢。
英特爾的自動駕駛平臺則依附于Mobileye攝像頭,主要基于長期的目標來做決策,憑低功耗的主打優(yōu)勢穩(wěn)坐ADAS前端市場的頭把交椅。
自動駕駛先驅(qū)特斯拉在推出自己的完全自動駕駛計算芯片(FSD)前,早期曾與Mobileye合作開發(fā)第一代Autopilot系統(tǒng),后又改用NVIDIA Drive PX 2為其第二代Autopilot系統(tǒng)提供動力。
中國新造車公司蔚來汽車則在今年11月剛剛宣布牽手Mobileye共同開發(fā)L4級自動駕駛。
谷歌Waymo雖未與Mobileye合作,使用的是自己的自動駕駛軟件和地圖,但它也依靠了英特爾至強處理器和可編程芯片(FPGA)來提供計算動力。
自動駕駛絕不是一塊好切割的蛋糕,因為它關乎人的生命安危,安全問題的重要性被排在絕對的首位。
就在幾個月前,英特爾和NVIDIA在這一方面的“暗斗”變成了“明撕”。
2019年3月,英特爾高級副總裁兼Mobileye CEO Amnon Shashua公開發(fā)表文章《創(chuàng)新需要獨創(chuàng)性》,質(zhì)疑NVIDIA新推出的SFF安全模型模仿了英特爾2017年發(fā)布的RSS自動駕駛安全標準提案,并在博客中附上了8頁分析對比雙方技術相似度的PDF。
▲部分SFF與RSS相似度比較
博客中,Amnon表示“好奇地看到NVIDIA創(chuàng)造了‘同類首創(chuàng)’的創(chuàng)新”、在閱讀SFF白皮書后“感到像照鏡子一樣怪異”,還稱此前Mobileye推出的全球首個眾包地圖技術REM和新自動駕駛類別L2+也被NVIDIA效仿。
隨后NVIDIA創(chuàng)始人兼CEO黃仁勛做出回應: “他(Amnon)是個偉人,但在這件事上他是錯的?!盡obileye和NVIDIA都通過應用數(shù)學方法來確保汽車避免發(fā)生事故,采取的方法相似但不同。
黃仁勛認為,自動駕駛安全應開放技術提供大量創(chuàng)新和新想法,而不是試圖阻止創(chuàng)新,有很多方法可以實現(xiàn)安全的共同目標。
Amnon的質(zhì)疑并沒有影響到NVIDIA繼續(xù)拓展和汽車廠商的緊密合作。在最近的NVIDIA GTC China大會上,NVIDIA宣布牽手中國最大的網(wǎng)約車公司滴滴出行,幫助滴滴打造L4級自動駕駛和云計算解決方案。
高通在汽車半導體市場的胃口也不小。2016年10月,高通宣布擬以440億美元收購全球最大汽車芯片制造商恩智浦,可惜最終沒能通過中國監(jiān)管部門這一關,該交易在2018年7月徹底“涼涼”。
不過高通向汽車領域的挺進并未因此而終止。高通憑借驍龍汽車平臺打出“極速連接+智能計算”的低功耗解決方案,以車聯(lián)網(wǎng)為其自動駕駛和汽車業(yè)務的關鍵支點,還在今年10月聯(lián)合30余家中國汽車產(chǎn)業(yè)鏈企業(yè)展示安全可靠的蜂窩車聯(lián)網(wǎng)(C-V2X)直接通信技術。
看起來,高通的芯片方案與Mobileye有異曲同工之處,并且在通信和SoC領域有專長,但鑒于NVIDIA和Mobileye已然在AV和ADAS領域領先,高通要撼動這一版圖絕非易事,它在汽車安全方面的實力也有待進一步證明。
中國,AI芯片必爭之地
中國正成為新AI芯片市場爭奪戰(zhàn)中的關鍵市場。
賽迪顧問2019年8月發(fā)布的《中國人工智能芯片產(chǎn)業(yè)發(fā)展白皮書》顯示,2018年中國AI芯片市場整體規(guī)模達到80.8億元,同比增長50.2%,在全球AI芯片市場占比最大,約占四分之一。
更多傳統(tǒng)企業(yè)入局AI,推動了整個中國AI應用的日趨繁榮,也為精通底層解決方案的半導體巨頭們帶來更廣闊的市場空間。
去年中國已超越美國成為英特爾第一大市場。2020財年前9個月的NVIDIA財報中,中國臺灣地區(qū)和中國大陸加起來在NVIDIA總營收中的占比超過一半。高通也在首次公布云端推理時就表示美國和中國的主要云服務提供商都表示了對Cloud AI 100的興趣。
為了更好融入中國市場,今年10月,Mobileye還同紫光集團在中國成立了一家合資公司,紫光持股51%、Mobileye持股49%,主攻中國的智能車載市場。
半導體巨頭瞄準的早已不只是某一特定領域的戰(zhàn)場,而是所有AI應用方對整體AI系統(tǒng)的需求,而串聯(lián)起各硬件平臺,最大化自身生態(tài)優(yōu)勢的關鍵工具,就是統(tǒng)一的軟件平臺。
一方面,軟件的優(yōu)化能幫助硬件進一步提升AI任務計算速度,并做到兼容未來的應用。
比如過去兩年,NVIDIA僅通過軟件和庫的完善就將計算機整體性能提升4倍,并保證CUDA平臺未來持續(xù)升級的軟件在現(xiàn)有硬件依然能流暢運行。
另一方面,統(tǒng)一的軟件開發(fā)平臺將大大降低開發(fā)者門檻不僅面向硬件開發(fā)者簡化流程,使開發(fā)者用一套軟件就能開發(fā)云邊端各類硬件,而且也為軟件開發(fā)者打通從軟件到芯片開發(fā)的直接路徑。
NVIDIA借助統(tǒng)一CUDA構(gòu)筑了龐大的生態(tài)壁壘,英特爾打造了統(tǒng)一編程方法oneAPI來為開發(fā)者提供跨平臺、跨架構(gòu)的統(tǒng)一編程體驗,華為給開發(fā)者準備了“AI芯片+數(shù)據(jù)庫+芯片開發(fā)工具+AI框架+AI應用平臺”全家桶,高通也承諾將為Cloud AI Cloud提供良好的軟件堆棧。
即便越來越多云計算、算法廠商對造芯躍躍欲試,他們中多數(shù)芯片產(chǎn)品的背后都或多或少有半導體巨頭的身影,無論是從硬件技術沉淀,還是長年積累的對客戶的理解,半導體巨頭們都是造芯合作伙伴最佳選擇。
這場由AI應用需求引發(fā)的芯片革命,反過來又推動著中國AI市場快速擴張和繁榮。
結(jié)語:2020年,AI芯片落地戰(zhàn)升級
回頭來看,半導體巨頭們在AI芯片領域的擴張路數(shù)不盡相同。
有的將內(nèi)部團隊再劃分,有的外招新團隊,有的則揮金如土大肆并購,直接把成熟的公司團隊及產(chǎn)品買下來。
盡管新的技術浪潮總會孕育出一批批充滿活力和創(chuàng)新能力的新初創(chuàng)企業(yè),但若論資金、技術實力、工程資源、品牌認可,在云-邊-端相輔相成的AI芯片戰(zhàn)場,半導體巨頭們?nèi)跃哂邢喈數(shù)母偁幜Α?/p>
AI芯片的競爭才剛剛開始,NVIDIA能否成功守壘、英特爾能否真正協(xié)同好各計算架構(gòu),高通能拿到多少數(shù)據(jù)中心市場蛋糕,華為的AI大網(wǎng)如何與其云計算齊頭并進,未來還充滿變數(shù)。
不過可以確定的是,2020年將成為AI芯片落地正面較量的關鍵之年。