面對AI核心難題,華為應(yīng)該如何應(yīng)對
算力為大數(shù)據(jù)的發(fā)展提供堅實的基礎(chǔ)保障,大數(shù)據(jù)的爆發(fā)式增長,給現(xiàn)有算力提出了巨大挑戰(zhàn)?;ヂ?lián)網(wǎng)時代的大數(shù)據(jù)高速積累,全球數(shù)據(jù)總量幾何式增長,現(xiàn)有的計算能力已經(jīng)不能滿足需求。據(jù)IDC報告,全球信息數(shù)據(jù)90% 產(chǎn)生于最近幾年。并且到2020年,40% 左右的信息會被云計算服務(wù)商收存,其中1/3 的數(shù)據(jù)具有價值。
近日OpenAI近期發(fā)布的研究顯示,僅2012年以來,人們對于算力的需求增長六年就超過30萬倍,平均每年增長10倍,遠遠超過了摩爾定律的發(fā)展速度。
作為AI的后入局者,面對AI算力需求的爆發(fā)式增長,華為大膽地提出要為業(yè)界提供“易獲取、用得起、方便用”的算力。如今,距離AI戰(zhàn)略提出一年,華為是否已經(jīng)找到算力破局的入口?
人工智能:第四次工業(yè)革命代表技術(shù)
17世紀后期,英國采礦業(yè)特別是煤礦已發(fā)展到相當?shù)囊?guī)模,單靠人力、畜力已難以滿足排除礦井地下水的要求,而現(xiàn)場又有豐富而廉價的煤作為燃料。現(xiàn)實的需要促使人們致力于“以火力提水”的探索。1769年英國人詹姆斯·瓦特制造了蒸汽機,引起了18世紀的第一次工業(yè)革命。
100年后,美國人發(fā)明和實現(xiàn)了電力的廣泛使用,引領(lǐng)了19世紀的第二次工業(yè)革命。
1946年,世界第一臺二進制計算機的發(fā)明,人類在20世紀進入了第三次工業(yè)革命,信息技術(shù)的發(fā)展尤其是移動互聯(lián)網(wǎng)的普及極大地改變了人類的生活。
進入21世紀,人類正在迎來以智能技術(shù)為代表的第四次工業(yè)革命,人工智能、物聯(lián)網(wǎng)、5G以及生物工程等新技術(shù)融入到人類社會方方面面;驅(qū)動全球宏觀趨勢的變化,如社會可持續(xù)發(fā)展,經(jīng)濟增長的新動能,智慧城市、產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型、消費體驗等。
人工智能是一系列新的通用目的技術(shù)(GPT),包括自然語言處理、圖片識別、視頻分析等。人工智能是信息化進程的新高度,信息技術(shù)帶來了效率的提升,人工智能則帶來生產(chǎn)成本的變化。行業(yè)+AI,人工智能將會改變每個行業(yè)、每個職業(yè)、每個組織、每個家庭和每個人。
易獲取、用得起,方便用的算力是AI發(fā)展關(guān)鍵
時代又仿佛回到了對采礦行業(yè)非生物動力需求極大的17世紀,進入21世紀,人工智能也對算力提出了強勁的增長需求。AI算力需求的急劇增長與傳統(tǒng)CPU算力緩慢提升(每年10%)之間存在巨大矛盾,全球掀起造芯運動,加速算力成本降低和AI應(yīng)用普及。
人工智能的支撐要素包括算力(工業(yè)云計算和邊緣計算)、數(shù)據(jù)(工業(yè)大數(shù)據(jù))和算法(工業(yè)人工智能),在中國,基于人口規(guī)模和經(jīng)濟的發(fā)展程度,在數(shù)據(jù)和行業(yè)應(yīng)用都在全球處于領(lǐng)先地位。但是AI算力資源卻很稀缺而且昂貴,各行業(yè)應(yīng)用需要越來越強勁的AI算力。
算力價格貴、使用難和資源難獲取是目前AI發(fā)展的三大瓶頸:
·價格貴:現(xiàn)在人工智能整個訓練的過程,譬如訓練人臉識別、交通綜合治理、自動駕駛,模型的訓練成本非常高昂的。
·使用難:缺乏一個統(tǒng)一的開發(fā)框架,無法適配從訓練到推理,從公有云到私有云、邊緣、終端的多種應(yīng)用場景,開發(fā)、調(diào)優(yōu)、部署的工作量巨大。
·難獲?。簶I(yè)界用于AI計算的GPU供貨周期長,限量供應(yīng)等,導(dǎo)致硬件資源不易獲取。
業(yè)界開發(fā)大規(guī)模AI訓練芯片的主要廠家,比如英偉達、谷歌和華為都推出了自己的AI訓練芯片。英偉達Tesla V100 GPU最高提供125 TeraFLOPS深度學習性能,最大功耗為300瓦特。Google I/O 2018開發(fā)者大會上,Google推出了第三代TPU 3.0,最高提供90 TeraFLOPS深度學習性能。華為在2018年10月的全聯(lián)接大會上發(fā)布了針對AI訓練場景的昇騰昇騰910 AI處理器。昇騰910 AI處理器,是當前計算密度最大的單芯片,適用于AI訓練,可提供256 TeraFLOPS的算力,最大功耗為310瓦特。
面向人工智能這個大的時代潮流,算力的稀缺和昂貴在一定程度上制約了當前的人工智能發(fā)展。
華為拿什么破解AI核心難題?
華為數(shù)十年長期聚焦在ICT基礎(chǔ)設(shè)施研發(fā)和建設(shè)領(lǐng)域,深刻理解運營商和企業(yè)用戶的使用場景,以“高起點”和“全棧全場景”入局AI領(lǐng)域,真正提供普惠的、強大的算力。
華為昇騰系列AI處理器采用了面向張量計算的達芬奇3D Cube架構(gòu),該架構(gòu)面向AI的全新突破性設(shè)計,為昇騰AI處理器提供了超強的AI算力,使得芯片具有高算力、高能效、可擴展的優(yōu)點?;诮y(tǒng)一的達芬奇架構(gòu),華為可以支持Ascend-Nano、Ascend-Tiny、Ascend-Lite、Ascend-Mini、Ascend-Max等芯片規(guī)格,具備從幾十毫瓦IP到幾百瓦芯片的平滑擴展,天然覆蓋了端、邊、云的全場景部署的能力。
“達芬奇架構(gòu)可大可小,從Nano一直到Max、從穿戴設(shè)備一直到云,可以全場景覆蓋;我們推出MindSpore的目的就是協(xié)同達芬奇架構(gòu)來面向全場景的。
也就是說,在端、邊緣、云都可以訓練和推理,還可以進行相互協(xié)同,這是現(xiàn)在其他的計算框架所做不到的。”華為輪值董事長徐直軍在先前的媒體采訪中表示。
AI訓練的耗時與模型的復(fù)雜度、數(shù)據(jù)集和硬件資源的配置是強相關(guān),在天文研究、自動駕駛訓練、氣象預(yù)測、石油勘探等大規(guī)模訓練時,硬件資源尤其顯得重要。
人工智能的快速發(fā)展,得益于硬件和云計算技術(shù)的提升,更得益于各個行業(yè)數(shù)字化帶來的大量的數(shù)據(jù)來訓練模型。開發(fā)平臺要求從原始數(shù)據(jù)到標注數(shù)據(jù)、訓練數(shù)據(jù)、算法、模型、推理服務(wù),實現(xiàn)千萬級模型、數(shù)據(jù)集以及服務(wù)對象的全生命周期的管理。
同時,無智能不成云,全棧發(fā)展走向縱深,AI已經(jīng)成為云的基礎(chǔ)業(yè)務(wù),實現(xiàn)云端訓練和推理。在云上部署,支持在線和批量的推理,滿足大規(guī)模并發(fā)的復(fù)雜場景需求。云、AI、IoT協(xié)調(diào)使能藍海市場,在智慧家庭、物聯(lián)網(wǎng)和車聯(lián)網(wǎng)等場景,構(gòu)建云+AI+IoT的綜合解決方案,開拓新的人工智能市場。
華為的AI戰(zhàn)略包括投資基礎(chǔ)研究,在計算視覺、自然語言處理、決策推理等領(lǐng)域構(gòu)筑數(shù)據(jù)高效(更少的數(shù)據(jù)需求)、能耗高效(更低的算力和能耗),安全可信、自動自治的機器學習基礎(chǔ)能力;打造全棧方案,面向云、邊緣和端等全場景的、獨立的以及協(xié)同的、全棧解決方案,提供充裕的、經(jīng)濟的算力資源,簡單易用、高效率、全流程的AI平臺。
大數(shù)據(jù)是人工智能發(fā)展的基礎(chǔ)保障,是人工智能這臺機器高速運轉(zhuǎn)的燃料。沒有大數(shù)據(jù)的支撐,人工智能就沒有了燃料,談不上發(fā)展。算力是人工智能發(fā)展的技術(shù)保障,是人工智能發(fā)展的動力和引擎。二者都是人工智能密不可分的一部分。反過來,人工智能的發(fā)展和應(yīng)用又會反過來提升大數(shù)據(jù)和算力的技術(shù)革新,提高大數(shù)據(jù)和算力的水平。三者相輔相成,融合發(fā)展,才是未來信息時代發(fā)展的潮流趨勢。