全球最強!華為昇騰 910 AI 芯片正式商用,全場景 AI 框架 MindSpore 問世
2018 年 10 月,在華為 2018 全聯(lián)接大會上,華為對外宣布了昇騰 910 芯片(Ascend 910)芯片,號稱是全球已經(jīng)發(fā)布的單芯片計算密度最大的 AI 芯片——當然,從宣布到商用也需要一個過程,華為當時表示會在 2019 年第二季度商用。
2019 年 8 月 23 日,伴隨著一場專門的發(fā)布會,昇騰 910 的商用終于到來。
全球算力最強 AI 處理器,即將商用在發(fā)布會上,華為徐直軍表示,去年昇騰 910 宣布之后,華為內(nèi)部已經(jīng)進行了測試。結(jié)果顯示,在算力方面,昇騰 910 完全達到了設計規(guī)格,也就是:半精度 (FP16) 算力達到256 Tera-FLOPS,整數(shù)精度 (INT8) 算力達到 512 Tera-OPS。更重要的是,昇騰 910 達到規(guī)格算力所需的功耗僅為 310W,明顯低于設計規(guī)格的 350W。
由此,徐直軍表示:
昇騰 910 總體技術表現(xiàn)超出預期,作為算力最強 AI 處理器,當之無愧。我們已經(jīng)把昇騰 910 用于實際 AI 訓練任務。
針對未來的計劃,徐直軍表示,針對不同的場景,包括邊緣計算、自動駕駛車載計算、訓練等場景,華為將持續(xù)投資并推出更多的 AI 處理器,面向全場景持續(xù)提供更充裕、更經(jīng)濟、更適配的AI 算力。記者注意到,在發(fā)布會上,徐直軍已經(jīng)公布了部分 AI 芯片的名稱,比如說昇騰 610、昇騰 620,還有昇騰 920。
記者了解到,早在 2018 年 10 月,華為就已經(jīng)宣布了昇騰 910 的不少關鍵信息。昇騰 910是一款服務器芯片,具體參數(shù)為:
半精度為(FP 16):256 TeraFLOPS;
整數(shù)精度(INT8):512 TeraOPS;
128 通道 全高清 視頻解碼器- H.264/265;
最大功耗 350 W;
采用 7nm 工藝。
當時,徐直軍還表示,華為昇騰 910 芯片將不會對外單獨銷售,而是以 AI 加速卡、加速模塊、服務器和一體機等模式對外銷售。
另外,在前不久舉行的 Hot Chips 大會上,華為介紹了旗下的 AI 芯片所采用的達芬奇(Da Vinci)架構,其中就包括昇騰 910 芯片。
據(jù)記者了解,華為的達芬奇核心分為三種,最完整的是 Max,其次是 Lite,再次是 Tiny,Max 可在一個周期內(nèi)完成 8192 次 MAC 運算,Tiny 為 512次。就具體芯片來說,昇騰 910 屬于 Ascend-Max 系列,它基于 7nm 增強版 EUV 工藝,單 Die 內(nèi)建 32 顆達芬奇核心,半精度高達 256TFOPs,功耗為 350W。
值得一提的是,在 HotChips 大會上,華為還將昇騰 910 的計算密度與 NVIDIA Tesla V100 和 Google TPU v3 進行了對比,其中昇騰 910 的計算密度遠遠超過了這兩個競爭對手。
MindSpore 框架發(fā)布,明年 Q1 開源除了昇騰 910 AI 處理器,華為還發(fā)布了 MindSpore 計算框架,這是與 TensorFlow、PyTorch、PaddlePaddle 等框架競標的一款產(chǎn)品。
去年華為全聯(lián)接大會上,華為提出,AI 框架應該是開發(fā)態(tài)友好(例如顯著減少訓練時間和成本)和運行態(tài)高效(例如最少資源和最高能效比),更重要的是,要能適應每個場景包括端、邊緣和云。經(jīng)過近一年的努力,全場景 AI 計算框架 MindSpore 在這三個方面都取得了顯著進展。
全場景支持,是在隱私保護日漸重要的背景下,實現(xiàn) AI 無所不在越來越基礎的需求,也是 MindSpore 的重要特色。針對不同的運行環(huán)境,MindSpore 框架架構上支持可大可小,適應全場景獨立部署。MindSpore 框架通過協(xié)同經(jīng)過處理后的、不帶有隱私信息的梯度、模型信息,而不是數(shù)據(jù)本身,以此實現(xiàn)在保證用戶隱私數(shù)據(jù)保護的前提下跨場景協(xié)同。
除了隱私保護,MindSpore 還將模型保護 Built-in 到 AI 框架中,實現(xiàn)模型的安全可信。 在原生適應每個場景包括端,邊緣和云,并能夠按需協(xié)同的基礎上,通過實現(xiàn) AI 算法即代碼,使開發(fā)態(tài)變得更加友好,顯著減少模型開發(fā)時間。
以一個 NLP(自然語言處理)典型網(wǎng)絡為例,相比其他框架,用 MindSpore 可降低核心代碼量 20%,開發(fā)門檻大大降低,效率整體提升 50% 以上。通過 MindSpore 框架自身的技術創(chuàng)新及其與昇騰處理器協(xié)同優(yōu)化,有效克服 AI 計算的復雜性和算力的多樣性挑戰(zhàn),實現(xiàn)了運行態(tài)的高效,大大提高了計算性能。除了昇騰處理器,MindSpore 同時也支持 GPU、CPU 等其它處理器。
為了更好促進 AI 的應用,徐直軍宣布 “MindSpore 將在 2020 年 Q1 開源”,助力每一位開發(fā)者,促進 AI 產(chǎn)業(yè)生態(tài)發(fā)展。
記者總結(jié)正如記者所報道的那樣,華為在 2018 全聯(lián)接大會上全面發(fā)布了 AI 戰(zhàn)略和華為的全棧全場景 AI 解決方案;其中全場景包括公有云、私有云、各種邊緣計算、物聯(lián)網(wǎng)行業(yè)終端以及消費類終端等部署環(huán)境,全棧是技術功能視角,是指包括芯片、芯片使能、訓練和推理框架和應用使能在內(nèi)的全堆棧方案。
在這次的發(fā)布會上,徐直軍表示,伴隨著今天昇騰 910 AI 處理器以及 MindSpore 全場景 AI 計算框架的發(fā)布,華為全棧全場景 AI 解決方案各重要組成部分悉數(shù)登場,由此華為也已完成了全棧全場景 AI 解決方案的構建。
另外,徐直軍還表示,在今年 9 月 18 日的華為全聯(lián)接大會上,華為將會發(fā)布更多的重磅 AI 產(chǎn)品——記者(公眾號:記者)將保持關注。