3月4日,中共中央政治局常務委員會召開會議,提出要發(fā)力于科技端的基礎設施建設,人工智能成為“新基建”七大版塊中的重要一項?!靶禄ā辈煌凇拌F公基”傳統(tǒng)思路,其本質是信息數(shù)字化的基礎設施建設,用于支撐傳統(tǒng)產業(yè)向網(wǎng)絡化、數(shù)字化、智能化方向發(fā)展。那么對于人工智能而言,“新基建”到底有何特點呢?筆者認為,與僅聚焦基礎硬實力建設的傳統(tǒng)基建思路不同,人工智能新基建更需要以應用需求為目標,發(fā)力軟硬協(xié)同,融合新老系統(tǒng),培育全新生態(tài)。那么在“新基建”浪潮的背景下,人工智能基礎設施應該建什么、怎樣建?
建什么?
聚焦算力提升,培育協(xié)同生態(tài)
當前,摩爾定律失效,算力需求增速已經遠遠超過了算力供給能力。人工智能所需的基礎算力具有獨特性。因此,人工智能新基建的核心是構建專用設施,填補算力不足,同時應在泛在、融合的發(fā)展趨勢下,構建軟硬件協(xié)同、新老系統(tǒng)協(xié)同、各個行業(yè)協(xié)同的產業(yè)新生態(tài)。
一是繼續(xù)夯實通用算力基礎。當前算力供給已經無法滿足智能化社會構建,根據(jù)OpenAI統(tǒng)計,從2012年至2019年,隨著深度學習“大深多”模型的演進,模型計算所需計算量已經增長30萬倍,無論是計算機視覺還是自然語言處理,由于預訓練模型的廣泛使用,模型所需算力直接呈現(xiàn)階躍式發(fā)展。據(jù)斯坦?!禔I INDEX 2019》報告,2012年之前,人工智能的計算速度緊追摩爾定律,算力需求每兩年翻一番,2012年以后,算力需求的翻番時長則直接縮短為3、4個月(如圖1所示)。面對已經每過20年才能翻一番的通用計算供給能力,算力捉襟見肘已經不言而喻。
深度學習算力遞增示意圖(來自《AI INDEX 2019》)
二是全面提升專屬計算能力。經過近兩年的研究及應用實踐沉淀,產業(yè)界逐漸發(fā)現(xiàn)以機器學習為代表的人工智能計算具有獨特性,具體表現(xiàn)在3個方面:第一就是機器學習計算大部分場景僅需要低精度計算即可,經過推測,一般應用場景下8比特即可滿足95%以上需求,無需FP32、FP16等高精度計算;第二就是機器學習計算只需要很小的操作指令集,在過去40年中開發(fā)的眾多使得通用程序能夠在現(xiàn)代CPU上以高性能運行的機制,例如分支預測器、推測執(zhí)行、超線程執(zhí)行處理核、深度緩存內存層次結構等,對于機器學習計算來說都是不必要的,機器學習只需要高性能運行矩陣乘法、向量計算、卷積核等線性代數(shù)計算即可;第三就是分布式特性,隨著模型不斷增大,深度學習“大深多”模型已經無法在單片芯片完成計算,多芯片多場景的異構計算需求使得機器學習計算必須考慮分布式的計算通信以及計算任務的協(xié)同調度,實現(xiàn)密集且高效的數(shù)據(jù)傳輸交互。
三是提前布局系統(tǒng)協(xié)同生態(tài)?;趯Ξa業(yè)界解決方案的梳理分析,筆者對于人工智能工程發(fā)展態(tài)勢有如下研判:為了更好滿足應用泛化的需求,未來人工智能應用及產業(yè)發(fā)展將呈現(xiàn)多平臺多系統(tǒng)協(xié)同態(tài)勢,以實現(xiàn)更為廣泛的賦能??梢钥吹?,當前階段,人工智能的主要賦能方式還是通過通用平臺,以聚合提供人工智能基礎技術能力的方式進行賦能,面向端側的一些成熟應用場景也出現(xiàn)了軟硬一體的端側應用系統(tǒng),如自動駕駛平臺、智慧安防攝像頭、基于智能語音語義的智能音箱、終端翻譯機等。但是通用平臺無法實現(xiàn)廣泛賦能,目前市面上的端側應用也是功能單一且能力固化。
在通用領域,通用平臺將進一步分化為提供人工智能基礎能力的基礎平臺和融合行業(yè)基礎應用的行業(yè)平臺兩個方向(如圖2所示)。實際上,現(xiàn)在阿里的城市大腦、騰訊的醫(yī)療優(yōu)圖等平臺,就已經開始呈現(xiàn)出從基礎通用功能平臺向行業(yè)應用能力平臺演進的態(tài)勢。
在專用領域,現(xiàn)有的端側應用無論是功能還是可擴展性上都遠遠達不到實際的泛化應用需求,因此未來面向泛化應用將呈現(xiàn)專用系統(tǒng)這個形態(tài),專用系統(tǒng)最大特點是它不僅僅是端側應用的軟硬件固化,而是通用平臺、行業(yè)平臺和端側應用的協(xié)同組合,以軟硬一體的方式實現(xiàn)具體應用的功能定制和擴展。這種工程發(fā)展態(tài)勢將對產業(yè)生態(tài)產生巨大影響,現(xiàn)在談及的人工智能芯片和框架,其實都屬于通用平臺和端側應用范疇,其生態(tài)主體是提供人工智能技術的科技企業(yè),而到了專用系統(tǒng)階段,系統(tǒng)協(xié)同將成為主流,融合通用能力、行業(yè)能力、業(yè)務邏輯的專用系統(tǒng)將由垂直行業(yè)來牽頭打造,人工智能的生態(tài)主體也將逐漸變成人工智能技術的使用者,即各個垂直行業(yè)的傳統(tǒng)企業(yè)。
人工智能未來發(fā)展態(tài)勢分析
怎樣建?
構建三大能力,抓住機遇窗口
在此背景下,人工智能基礎設施建設應當建設以下3方面能力。
一是建計算加速能力。首先是建設面向訓練及推理的計算芯片。隨著人工智能融合賦能廣度和深度的不斷加強,不同場景應用將提出不同算力需求,以物聯(lián)網(wǎng)、移動終端、安防和自動駕駛為代表的專用端側推斷芯片百花齊放,人工智能正式進入算力定制化時代。為更好解決當前訓練算力昂貴、推理計算不足的局面,應聚焦功能多元化、架構多元化的人工智能基礎設施建設,針對性補充機器學習專屬操作計算能力,面向數(shù)值計算并行、數(shù)據(jù)跨域交換等進行攻關建設,積極探索多元化架構,以類腦計算、量子計算范式為突破口,實現(xiàn)機器學習計算能力加速。
其次是全面構建面向深度學習計算加速的理論及工程體系,全面涵蓋從算法頂層、編譯器,到體系結構等方面的加速理論及工程實踐能力,以大規(guī)模分布式學習需求為指引,優(yōu)化算法實現(xiàn)、打造深度學習編譯器,探索體系結構與硬件的最優(yōu)實踐。
二是建計算泛在能力。端側是人工智能最終應用的落地點,端側既是數(shù)據(jù)的生成端,也是數(shù)據(jù)的使用端,需要構建能夠滿足海量不同端側應用場景下的計算支撐能力。端側由于受到實時性、硬件能力、功耗等多種限制,需要針對人工智能模型實現(xiàn)不同層面的優(yōu)化,全面提升端側的數(shù)據(jù)計算、采集及傳輸能力,綜合考慮傳感器、端側芯片、端側軟件框架、網(wǎng)絡架構演進、數(shù)據(jù)中心協(xié)同等關鍵因素,構建能夠實現(xiàn)機器學習模型訓練、部署及動態(tài)更新的云端協(xié)同算法及工程實現(xiàn)能力,打造堅實的泛在計算基礎。
三是建協(xié)同生態(tài)能力。如圖2所示,未來人工智能通用平臺、行業(yè)平臺以及專用系統(tǒng)將呈現(xiàn)三大協(xié)同態(tài)勢,需要抓住窗口期,全面建設全新的系統(tǒng)協(xié)同能力。首先是構建3個系統(tǒng)間的協(xié)同能力。通用平臺、行業(yè)平臺以及面向具體應用的專用系統(tǒng)之間的功能界定將越來越明確,相關功能將呈現(xiàn)模塊化特性,并且高度互補,以實現(xiàn)深度協(xié)同。
其次是構建專用系統(tǒng)的軟硬協(xié)同能力。面向應用的專用系統(tǒng)為滿足業(yè)務實時響應要求,除了需要將專屬定制算力芯片進行部署外,還需要在軟件層面實現(xiàn)兩項功能:一是實現(xiàn)軟件與定制芯片的高度耦合,以達到性能最優(yōu);二是軟件需要與垂直行業(yè)平臺及通用平臺做好高效對接,保證調用所需平臺功能的實時性;三是構建行業(yè)協(xié)同能力,面向行業(yè)賦能的行業(yè)平臺將在通用平臺基礎上,抽取行業(yè)業(yè)務邏輯,沉淀行業(yè)服務能力,實現(xiàn)與行業(yè)已有業(yè)務系統(tǒng)的無縫對接。值得注意的是,行業(yè)平臺由其業(yè)務屬性主導,未來行業(yè)平臺的建設主體一定是由垂直行業(yè)來主導構建的。