全球最強(qiáng)!華為昇騰910 AI芯片正式商用 全場(chǎng)景AI框架MindSpore問(wèn)世
2018 年 10 月,在華為 2018 全聯(lián)接大會(huì)上,華為對(duì)外宣布了昇騰 910 芯片(Ascend 910)芯片,號(hào)稱是全球已經(jīng)發(fā)布的單芯片計(jì)算密度最大的 AI 芯片—;—;當(dāng)然,從宣布到商用也需要一個(gè)過(guò)程,華為當(dāng)時(shí)表示會(huì)在 2019 年第二季度商用。
2019 年 8 月 23 日,伴隨著一場(chǎng)專門(mén)的發(fā)布會(huì),昇騰 910 的商用終于到來(lái)。
全球算力最強(qiáng) AI 處理器,即將商用
在發(fā)布會(huì)上,華為徐直軍表示,去年昇騰 910 宣布之后,華為內(nèi)部已經(jīng)進(jìn)行了測(cè)試。結(jié)果顯示,在算力方面,昇騰 910 完全達(dá)到了設(shè)計(jì)規(guī)格,也就是:半精度 (FP16) 算力達(dá)到256 Tera-FLOPS,整數(shù)精度 (INT8) 算力達(dá)到 512 Tera-OPS。更重要的是,昇騰 910 達(dá)到規(guī)格算力所需的功耗僅為 310W,明顯低于設(shè)計(jì)規(guī)格的 350W。
由此,徐直軍表示:
昇騰 910 總體技術(shù)表現(xiàn)超出預(yù)期,作為算力最強(qiáng) AI 處理器,當(dāng)之無(wú)愧。我們已經(jīng)把昇騰 910 用于實(shí)際 AI 訓(xùn)練任務(wù)。
針對(duì)未來(lái)的計(jì)劃,徐直軍表示,針對(duì)不同的場(chǎng)景,包括邊緣計(jì)算、自動(dòng)駕駛車載計(jì)算、訓(xùn)練等場(chǎng)景,華為將持續(xù)投資并推出更多的 AI 處理器,面向全場(chǎng)景持續(xù)提供更充裕、更經(jīng)濟(jì)、更適配的AI 算力。雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))注意到,在發(fā)布會(huì)上,徐直軍已經(jīng)公布了部分 AI 芯片的名稱,比如說(shuō)昇騰 610、昇騰 620,還有昇騰 920。
雷鋒網(wǎng)了解到,早在 2018 年 10 月,華為就已經(jīng)宣布了昇騰 910 的不少關(guān)鍵信息。昇騰 910是一款服務(wù)器芯片,具體參數(shù)為:
半精度為(FP 16):256 TeraFLOPS;
整數(shù)精度(INT8):512 TeraOPS;
128 通道 全高清 視頻解碼器- H.264/265;
最大功耗 350 W;
采用 7nm 工藝。
當(dāng)時(shí),徐直軍還表示,華為昇騰 910 芯片將不會(huì)對(duì)外單獨(dú)銷售,而是以 AI 加速卡、加速模塊、服務(wù)器和一體機(jī)等模式對(duì)外銷售。
另外,在前不久舉行的 Hot Chips 大會(huì)上,華為介紹了旗下的 AI 芯片所采用的達(dá)芬奇(Da Vinci)架構(gòu),其中就包括昇騰 910 芯片。
據(jù)雷鋒網(wǎng)了解,華為的達(dá)芬奇核心分為三種,最完整的是 Max,其次是 Lite,再次是 Tiny,Max 可在一個(gè)周期內(nèi)完成 8192 次 MAC 運(yùn)算,Tiny 為 512次。就具體芯片來(lái)說(shuō),昇騰 910 屬于 Ascend-Max 系列,它基于 7nm 增強(qiáng)版 EUV 工藝,單 Die 內(nèi)建 32 顆達(dá)芬奇核心,半精度高達(dá) 256TFOPs,功耗為 350W。
值得一提的是,在 HotChips 大會(huì)上,華為還將昇騰 910 的計(jì)算密度與 NVIDIA Tesla V100 和 Google TPU v3 進(jìn)行了對(duì)比,其中昇騰 910 的計(jì)算密度遠(yuǎn)遠(yuǎn)超過(guò)了這兩個(gè)競(jìng)爭(zhēng)對(duì)手。
MindSpore 框架發(fā)布,明年 Q1 開(kāi)源
除了昇騰 910 AI 處理器,華為還發(fā)布了 MindSpore 計(jì)算框架,這是與 TensorFlow、PyTorch、PaddlePaddle 等框架競(jìng)標(biāo)的一款產(chǎn)品。
去年華為全聯(lián)接大會(huì)上,華為提出,AI 框架應(yīng)該是開(kāi)發(fā)態(tài)友好(例如顯著減少訓(xùn)練時(shí)間和成本)和運(yùn)行態(tài)高效(例如最少資源和最高能效比),更重要的是,要能適應(yīng)每個(gè)場(chǎng)景包括端、邊緣和云。經(jīng)過(guò)近一年的努力,全場(chǎng)景 AI 計(jì)算框架 MindSpore 在這三個(gè)方面都取得了顯著進(jìn)展。
全場(chǎng)景支持,是在隱私保護(hù)日漸重要的背景下,實(shí)現(xiàn) AI 無(wú)所不在越來(lái)越基礎(chǔ)的需求,也是 MindSpore 的重要特色。針對(duì)不同的運(yùn)行環(huán)境,MindSpore 框架架構(gòu)上支持可大可小,適應(yīng)全場(chǎng)景獨(dú)立部署。MindSpore 框架通過(guò)協(xié)同經(jīng)過(guò)處理后的、不帶有隱私信息的梯度、模型信息,而不是數(shù)據(jù)本身,以此實(shí)現(xiàn)在保證用戶隱私數(shù)據(jù)保護(hù)的前提下跨場(chǎng)景協(xié)同。
除了隱私保護(hù),MindSpore 還將模型保護(hù) Built-in 到 AI 框架中,實(shí)現(xiàn)模型的安全可信。 在原生適應(yīng)每個(gè)場(chǎng)景包括端,邊緣和云,并能夠按需協(xié)同的基礎(chǔ)上,通過(guò)實(shí)現(xiàn) AI 算法即代碼,使開(kāi)發(fā)態(tài)變得更加友好,顯著減少模型開(kāi)發(fā)時(shí)間。
以一個(gè) NLP(自然語(yǔ)言處理)典型網(wǎng)絡(luò)為例,相比其他框架,用 MindSpore 可降低核心代碼量 20%,開(kāi)發(fā)門(mén)檻大大降低,效率整體提升 50% 以上。通過(guò) MindSpore 框架自身的技術(shù)創(chuàng)新及其與昇騰處理器協(xié)同優(yōu)化,有效克服 AI 計(jì)算的復(fù)雜性和算力的多樣性挑戰(zhàn),實(shí)現(xiàn)了運(yùn)行態(tài)的高效,大大提高了計(jì)算性能。除了昇騰處理器,MindSpore 同時(shí)也支持 GPU、CPU 等其它處理器。
為了更好促進(jìn) AI 的應(yīng)用,徐直軍宣布 “MindSpore 將在 2020 年 Q1 開(kāi)源”,助力每一位開(kāi)發(fā)者,促進(jìn) AI 產(chǎn)業(yè)生態(tài)發(fā)展。
總結(jié)
正如雷鋒網(wǎng)所報(bào)道的那樣,華為在 2018 全聯(lián)接大會(huì)上全面發(fā)布了 AI 戰(zhàn)略和華為的全棧全場(chǎng)景 AI 解決方案;其中全場(chǎng)景包括公有云、私有云、各種邊緣計(jì)算、物聯(lián)網(wǎng)行業(yè)終端以及消費(fèi)類終端等部署環(huán)境,全棧是技術(shù)功能視角,是指包括芯片、芯片使能、訓(xùn)練和推理框架和應(yīng)用使能在內(nèi)的全堆棧方案。
在這次的發(fā)布會(huì)上,徐直軍表示,伴隨著今天昇騰 910 AI 處理器以及 MindSpore 全場(chǎng)景 AI 計(jì)算框架的發(fā)布,華為全棧全場(chǎng)景 AI 解決方案各重要組成部分悉數(shù)登場(chǎng),由此華為也已完成了全棧全場(chǎng)景 AI 解決方案的構(gòu)建。
另外,徐直軍還表示,在今年 9 月 18 日的華為全聯(lián)接大會(huì)上,華為將會(huì)發(fā)布更多的重磅 AI 產(chǎn)品—;—;雷鋒網(wǎng)將保持關(guān)注。