全球最強(qiáng)！華為昇騰910 AI芯片正式商用全場(chǎng)景AI框架MindSpore問(wèn)世

時(shí)間：2019-09-10 10:32:01

關(guān)鍵字：華為昇騰910

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]2018 年 10 月，在華為 2018 全聯(lián)接大會(huì)上，華為對(duì)外宣布了昇騰 910 芯片（Ascend 910）芯片，號(hào)稱是全球已經(jīng)發(fā)布的單芯片計(jì)算密度最大的 AI 芯片—;—;當(dāng)然，從宣布到商用也需

2018 年 10 月，在華為 2018 全聯(lián)接大會(huì)上，華為對(duì)外宣布了昇騰 910 芯片（Ascend 910）芯片，號(hào)稱是全球已經(jīng)發(fā)布的單芯片計(jì)算密度最大的 AI 芯片—;—;當(dāng)然，從宣布到商用也需要一個(gè)過(guò)程，華為當(dāng)時(shí)表示會(huì)在 2019 年第二季度商用。

2019 年 8 月 23 日，伴隨著一場(chǎng)專門的發(fā)布會(huì)，昇騰 910 的商用終于到來(lái)。

全球算力最強(qiáng) AI 處理器，即將商用

在發(fā)布會(huì)上，華為徐直軍表示，去年昇騰 910 宣布之后，華為內(nèi)部已經(jīng)進(jìn)行了測(cè)試。結(jié)果顯示，在算力方面，昇騰 910 完全達(dá)到了設(shè)計(jì)規(guī)格，也就是：半精度 (FP16) 算力達(dá)到256 Tera-FLOPS，整數(shù)精度 (INT8) 算力達(dá)到 512 Tera-OPS。更重要的是，昇騰 910 達(dá)到規(guī)格算力所需的功耗僅為 310W，明顯低于設(shè)計(jì)規(guī)格的 350W。

由此，徐直軍表示：

昇騰 910 總體技術(shù)表現(xiàn)超出預(yù)期，作為算力最強(qiáng) AI 處理器，當(dāng)之無(wú)愧。我們已經(jīng)把昇騰 910 用于實(shí)際 AI 訓(xùn)練任務(wù)。

針對(duì)未來(lái)的計(jì)劃，徐直軍表示，針對(duì)不同的場(chǎng)景，包括邊緣計(jì)算、自動(dòng)駕駛車載計(jì)算、訓(xùn)練等場(chǎng)景，華為將持續(xù)投資并推出更多的 AI 處理器，面向全場(chǎng)景持續(xù)提供更充裕、更經(jīng)濟(jì)、更適配的AI 算力。雷鋒網(wǎng)(公眾號(hào)：雷鋒網(wǎng))注意到，在發(fā)布會(huì)上，徐直軍已經(jīng)公布了部分 AI 芯片的名稱，比如說(shuō)昇騰 610、昇騰 620，還有昇騰 920。

雷鋒網(wǎng)了解到，早在 2018 年 10 月，華為就已經(jīng)宣布了昇騰 910 的不少關(guān)鍵信息。昇騰 910是一款服務(wù)器芯片，具體參數(shù)為：

半精度為（FP 16）：256 TeraFLOPS；

整數(shù)精度（INT8）：512 TeraOPS；

128 通道全高清視頻解碼器- H.264/265；

最大功耗 350 W；

采用 7nm 工藝。

當(dāng)時(shí)，徐直軍還表示，華為昇騰 910 芯片將不會(huì)對(duì)外單獨(dú)銷售，而是以 AI 加速卡、加速模塊、服務(wù)器和一體機(jī)等模式對(duì)外銷售。

另外，在前不久舉行的 Hot Chips 大會(huì)上，華為介紹了旗下的 AI 芯片所采用的達(dá)芬奇（Da Vinci）架構(gòu)，其中就包括昇騰 910 芯片。

據(jù)雷鋒網(wǎng)了解，華為的達(dá)芬奇核心分為三種，最完整的是 Max，其次是 Lite，再次是 Tiny，Max 可在一個(gè)周期內(nèi)完成 8192 次 MAC 運(yùn)算，Tiny 為 512次。就具體芯片來(lái)說(shuō)，昇騰 910 屬于 Ascend-Max 系列，它基于 7nm 增強(qiáng)版 EUV 工藝，單 Die 內(nèi)建 32 顆達(dá)芬奇核心，半精度高達(dá) 256TFOPs，功耗為 350W。

值得一提的是，在 HotChips 大會(huì)上，華為還將昇騰 910 的計(jì)算密度與 NVIDIA Tesla V100 和 Google TPU v3 進(jìn)行了對(duì)比，其中昇騰 910 的計(jì)算密度遠(yuǎn)遠(yuǎn)超過(guò)了這兩個(gè)競(jìng)爭(zhēng)對(duì)手。

MindSpore 框架發(fā)布，明年 Q1 開源

除了昇騰 910 AI 處理器，華為還發(fā)布了 MindSpore 計(jì)算框架，這是與 TensorFlow、PyTorch、PaddlePaddle 等框架競(jìng)標(biāo)的一款產(chǎn)品。

去年華為全聯(lián)接大會(huì)上，華為提出，AI 框架應(yīng)該是開發(fā)態(tài)友好（例如顯著減少訓(xùn)練時(shí)間和成本）和運(yùn)行態(tài)高效（例如最少資源和最高能效比），更重要的是，要能適應(yīng)每個(gè)場(chǎng)景包括端、邊緣和云。經(jīng)過(guò)近一年的努力，全場(chǎng)景 AI 計(jì)算框架 MindSpore 在這三個(gè)方面都取得了顯著進(jìn)展。

全場(chǎng)景支持，是在隱私保護(hù)日漸重要的背景下，實(shí)現(xiàn) AI 無(wú)所不在越來(lái)越基礎(chǔ)的需求，也是 MindSpore 的重要特色。針對(duì)不同的運(yùn)行環(huán)境，MindSpore 框架架構(gòu)上支持可大可小，適應(yīng)全場(chǎng)景獨(dú)立部署。MindSpore 框架通過(guò)協(xié)同經(jīng)過(guò)處理后的、不帶有隱私信息的梯度、模型信息，而不是數(shù)據(jù)本身，以此實(shí)現(xiàn)在保證用戶隱私數(shù)據(jù)保護(hù)的前提下跨場(chǎng)景協(xié)同。

除了隱私保護(hù)，MindSpore 還將模型保護(hù) Built-in 到 AI 框架中，實(shí)現(xiàn)模型的安全可信。在原生適應(yīng)每個(gè)場(chǎng)景包括端，邊緣和云，并能夠按需協(xié)同的基礎(chǔ)上，通過(guò)實(shí)現(xiàn) AI 算法即代碼，使開發(fā)態(tài)變得更加友好，顯著減少模型開發(fā)時(shí)間。

以一個(gè) NLP（自然語(yǔ)言處理）典型網(wǎng)絡(luò)為例，相比其他框架，用 MindSpore 可降低核心代碼量 20%，開發(fā)門檻大大降低，效率整體提升 50% 以上。通過(guò) MindSpore 框架自身的技術(shù)創(chuàng)新及其與昇騰處理器協(xié)同優(yōu)化，有效克服 AI 計(jì)算的復(fù)雜性和算力的多樣性挑戰(zhàn)，實(shí)現(xiàn)了運(yùn)行態(tài)的高效，大大提高了計(jì)算性能。除了昇騰處理器，MindSpore 同時(shí)也支持 GPU、CPU 等其它處理器。

為了更好促進(jìn) AI 的應(yīng)用，徐直軍宣布 “MindSpore 將在 2020 年 Q1 開源”，助力每一位開發(fā)者，促進(jìn) AI 產(chǎn)業(yè)生態(tài)發(fā)展。

總結(jié)

正如雷鋒網(wǎng)所報(bào)道的那樣，華為在 2018 全聯(lián)接大會(huì)上全面發(fā)布了 AI 戰(zhàn)略和華為的全棧全場(chǎng)景 AI 解決方案；其中全場(chǎng)景包括公有云、私有云、各種邊緣計(jì)算、物聯(lián)網(wǎng)行業(yè)終端以及消費(fèi)類終端等部署環(huán)境，全棧是技術(shù)功能視角，是指包括芯片、芯片使能、訓(xùn)練和推理框架和應(yīng)用使能在內(nèi)的全堆棧方案。

在這次的發(fā)布會(huì)上，徐直軍表示，伴隨著今天昇騰 910 AI 處理器以及 MindSpore 全場(chǎng)景 AI 計(jì)算框架的發(fā)布，華為全棧全場(chǎng)景 AI 解決方案各重要組成部分悉數(shù)登場(chǎng)，由此華為也已完成了全棧全場(chǎng)景 AI 解決方案的構(gòu)建。

另外，徐直軍還表示，在今年 9 月 18 日的華為全聯(lián)接大會(huì)上，華為將會(huì)發(fā)布更多的重磅 AI 產(chǎn)品—;—;雷鋒網(wǎng)將保持關(guān)注。