華為昨日在上海舉辦了一場特殊的全鏈接大會,完整地公布了華為人工智能戰(zhàn)略,也公開了“達芬奇項目”,并且重磅發(fā)布了Ascend(昇騰)系列兩款AI芯片,震驚業(yè)界。那么昇騰芯片具體規(guī)劃是怎樣的?是否會向外界預測的那樣與芯片巨頭英偉達直接競爭?昇騰芯片與華為自家的麒麟芯片是怎樣的關系?下面,智能菌就為大家梳理華為昇騰芯片誕生的背景與歷程。
在全鏈接大會上,華為將公司的人工智能發(fā)展戰(zhàn)略和盤托出,分為五個部分:
1、投資基礎研究:在計算視覺、自然語言處理、決策推理等領域構筑數(shù)據(jù)高效(更少的數(shù)據(jù)需求)、能耗高效(更低的算力和能耗),安全可信、自動自治的機器學習基礎能力。
2、打造全棧方案:打造面向云、邊緣和端等全場景的、獨立的以及協(xié)同的、全棧解決方案,提供充裕的、經(jīng)濟的算力資源,簡單易用、高效率、全流程的 AI 平臺。
3、投資開放生態(tài)和人才培養(yǎng):面向全球,持續(xù)與學術界、產(chǎn)業(yè)界和行業(yè)伙伴廣泛合作,打造人工智能開放生態(tài),培養(yǎng)人工智能人才。
4、解決方案增強:把 AI 思維和技術引入現(xiàn)有產(chǎn)品和服務,實現(xiàn)更大價值、更強競爭力。
5、內(nèi)部效率提升:應用 AI 優(yōu)化內(nèi)部管理,對準海量作業(yè)場景,大幅度提升內(nèi)部運營效率和質(zhì)量。
其中,華為全棧全場景AI解決方案是整個戰(zhàn)略的核心,包括四個方面:
1、基于可統(tǒng)一、可擴展架構的系列化AI IP和芯片Ascend。
2、芯片算子庫和高度自動化算子開發(fā)工具CANN。
3、支持端、邊、云獨立的和協(xié)同的統(tǒng)一訓練和推理框架的MindSpore。
4、提供全流程服務ModelArts,分層API和預集成方案的應用使能。
在這個方案中,華為自研的AI芯片算是重中之重。徐直軍表示,“如果說算力的進步是當下 AI 大發(fā)展的主要驅(qū)動因素,那么,算力的稀缺和昂貴正在成為制約 AI 全面發(fā)展的核心因素。”
Ascend名字在華為的使用歷程
說到Ascend這個名字,華為最早將其用在了智能手機初期。華為將Ascend分為四個系列D、P、G、Y ,分別對應旗艦、高端、中端、入門。
2013年2月,Ascend P2發(fā)布,首次搭載了華為自家的海思K3V2四核處理器,因為4G牌照的問題,P2沒有在國內(nèi)上市。之后發(fā)布的Ascend D2,使用了相同的處理器。K3V2是海思半導體第一款成功市場化的手機處理器。
2013年6月,華為直接跳過了Ascend P3,在英國倫敦發(fā)布了Ascend P6手機,這款手機使用了海思K3V2E四核處理器,這款處理器在華為手機產(chǎn)品中扮演了極重要的角色,成為華為手機前期的大功臣。
2014年5月,華為在法國巴黎推出Ascend P7手機,搭載海思Kirin910T四核處理器。直到這時,華為自家的手機處理器從海思半導體分拆出麒麟系列。
2015年4月,華為在英國倫敦首發(fā)P8新機,搭載麒麟930/麒麟935處理器。這個時候,華為在手機中開始慢慢淡化Ascend,而直接以P系列來命名手機。
Ascend芯片的五大系列和規(guī)劃
現(xiàn)在的Ascend(昇騰)芯片是華為“達芬奇項目”的一部分,也是華為全棧人工智能解決方案的一部分。
Ascend是基于可統(tǒng)一、可擴展架構的系列化AI IP和芯片,昇騰芯片包括Max,Mini,Lite,Tiny和Nano等五個系列,基于“達芬奇架構”制造。
本次發(fā)布了兩款昇騰芯片,分別是昇騰910(Ascend 910),昇騰310(Ascend 310)。
徐直軍表示,昇騰910屬于Max系列,是目前發(fā)布的所有芯片中,計算密度最大的單芯片。該芯片采取7nm工藝制程,最大功耗為350W。“昇騰910可以達到256個T,是目前全球已發(fā)布單芯片數(shù)最大的AI芯片,比最近英偉達的V100還要高出1倍。”徐直軍表示。
昇騰310(Ascend 310)屬于Mini系列,是目前面向計算場景最強算力的AI SoC。昇騰310是昇騰迷你系列的第一款產(chǎn)品。據(jù)稱這款芯片功耗為8瓦,采用12nm 工藝,算力可達16TFLOPS,其集成了16通道全高清視頻解碼器。
此外,徐直軍還推出了5款基于昇騰310芯片的AI產(chǎn)品,包括AI加速模塊Atlas 200、AI加速卡Atlas 300、AI智能小站Atlas 500、AI一體機Atlas 800、以及移動數(shù)據(jù)中心MDC 600。
Lite、Tiny和Nano三個系列芯片將在明年發(fā)布。
在發(fā)布芯片的同時,華為還發(fā)布了大規(guī)模分布式訓練系統(tǒng) Ascend 集群,在設計中,該集群將包括 1024個 Asced 910芯片,算力達到 256P,大幅超過英偉達 DGX2 和谷歌 TPU 集群。這種服務器將同樣在 2019 年二季度推出,幫助開發(fā)者更快地訓練模型。
以下是外界對于華為AI芯片最關心的問題:
昇騰芯片將來是否會與英偉達直接競爭?
這此發(fā)布的兩款芯片都會在2019年第二季度上市,但徐直軍在隨后的媒體采訪環(huán)節(jié)表示,華為兩款AI芯片均不會單獨對外銷售,而是以AI加速模塊、AI服務器、云服務的形式面向第三方銷售。
徐直軍表示,“我們不直接向第三方提供芯片,而是提供基于芯片的硬件和云服務,我們和純芯片廠商沒有直接競爭。”
為何要自研架構,而不采用寒武紀等合作伙伴方案?
對于外界一直疑問的華為為何要搭建自己的”達芬奇架構“,而不用寒武紀等廠商的方案。徐直軍在采訪中回答到,“構建新架構來支持人工智能芯片,是因為這是基于華為對人工智能的理解,基于端管云對對人工智能的需求自然產(chǎn)生的。”
徐直軍表示,華為需要覆蓋從云、到邊緣、到端到物聯(lián)網(wǎng)端,需要全新的架構,創(chuàng)造力的架構。“寒武紀也很好,但無法支持我們的全場景。”
華為首席架構師黨文栓介紹說,Ascend 芯片采用統(tǒng)一達芬奇架構:可擴展計算、可擴展內(nèi)存、可擴展片上互聯(lián)。因此,這是全球首個覆蓋全場景的智能芯片系列。
華為為何一直如此專注開發(fā)AI芯片?
徐直軍認為,在目前數(shù)據(jù)隱私保護形勢下,很多事情無法單獨由云上的計算力完成,必須要在端側(cè)去完成。這是非常復雜的多目標的優(yōu)化問題。
“這往往要面對能耗和內(nèi)存的雙重限制,面對各種場景下的不同需求。比如在車載應用中要求響應速度很快,對各種圖片和視頻的處理精確度要求比較高,在聲音方面,降噪的要求就非常高,如何能夠利用GAN的方式去把聲紋和內(nèi)容分開,這中間往往牽扯到個人隱私。”徐直軍說到,華為主要目的是要在端側(cè)方面開發(fā)出高性能的芯片,將盡量多的處理過程在端側(cè)完成,爭取提供最好的用戶體驗。
麒麟芯片和昇騰芯片是怎樣的關系?
接近華為的人士表示,麒麟芯片將主打手機處理器,昇騰芯片主要是配合云服務來使用,像昇騰310這樣的芯片雖然未來也會用于手機、手表等設備,但大多是需要低功耗的地方。對此,華為一名Fellow稱,二者關系保密,明年揭曉。