華為首次發(fā)布計(jì)算戰(zhàn)略:全球最快AI訓(xùn)練集群面世
9月18日,在第四屆HUAWEI CONNECT 2019(華為全聯(lián)接大會),在本次大會上,中國工程院院士、鵬城實(shí)驗(yàn)室主任高文院士,分享了鵬城實(shí)驗(yàn)室與華為的合作,力求共同打造中國首個(gè)動(dòng)態(tài)進(jìn)化的E級AI超算系統(tǒng),構(gòu)建新一代人工智能基礎(chǔ)研究創(chuàng)新平臺。華為云業(yè)務(wù)總裁鄭葉來,則從商業(yè)應(yīng)用的角度,基于華為云在10多個(gè)行業(yè)、500多個(gè)項(xiàng)目的實(shí)踐,指出行業(yè)AI正在跨越商用裂谷,成為重塑企業(yè)數(shù)字化轉(zhuǎn)型的關(guān)鍵驅(qū)動(dòng)。
華為首次發(fā)布計(jì)算戰(zhàn)略,基于架構(gòu)創(chuàng)新、投資全場景處理器族、有所為有所不為的商業(yè)策略、構(gòu)建開放生態(tài)進(jìn)行布局。同時(shí),華為重磅發(fā)布了全球最快AI訓(xùn)練集群Atlas 900,加速科學(xué)研究與商業(yè)創(chuàng)新的智能化進(jìn)程。
華為首次發(fā)布計(jì)算戰(zhàn)略
華為副董事長胡厚崑表示,“我們面臨的是一個(gè)2萬億美元的計(jì)算產(chǎn)業(yè)大藍(lán)海,華為堅(jiān)定不移地投入計(jì)算產(chǎn)業(yè),通過對架構(gòu)創(chuàng)新的突破、對全場景處理器的投資、堅(jiān)持有所為有所不為的商業(yè)策略,以及構(gòu)建開放生態(tài)來布局戰(zhàn)略。”
第一,架構(gòu)創(chuàng)新。投資基礎(chǔ)研究,推出達(dá)芬奇架構(gòu),用創(chuàng)新的處理器架構(gòu)來匹配算力的增速。
第二,投資全場景處理器族,包括面向通用計(jì)算的鯤鵬系列,面向AI計(jì)算的昇騰系列,面向智能終端的麒麟系列,以及面向智慧屏的鴻鵠系列等。
第三,有所為有所不為的商業(yè)策略。華為不直接對外銷售處理器,以云服務(wù)面向客戶,以部件為主面向合作伙伴,優(yōu)先支持合作伙伴發(fā)展整機(jī)。
第四,構(gòu)建開放生態(tài)。未來5年,繼續(xù)投入15億美元,匯聚500萬開發(fā)者,使能全球合作伙伴開發(fā)應(yīng)用及解決方案。
Atlas 900創(chuàng)造全新世界紀(jì)錄
這款產(chǎn)品匯聚了華為十多年的技術(shù)沉淀,在衡量AI計(jì)算能力的金標(biāo)準(zhǔn)ResNet-50圖片分類模型下,Atlas 900只需59.8秒就完成了訓(xùn)練,在同等精度下比原來的世界紀(jì)錄快10秒。 “ ImageNet-1k數(shù)據(jù)集”包含128萬張圖片,精度為75.9%,在同等精度下,其他兩家業(yè)界主流廠家測試成績分別是70.2s和76.8s,Atlas 900 AI訓(xùn)練集群比第2名快15%。
據(jù)了解,Atlas 900 AI集群主要為大型數(shù)據(jù)集神經(jīng)網(wǎng)絡(luò)訓(xùn)練提供超強(qiáng)算力,可廣泛應(yīng)用于科學(xué)研究與商業(yè)創(chuàng)新,讓研究人員更快地進(jìn)行圖像、視頻和語音等AI模型訓(xùn)練,讓人類更高效地探索宇宙奧秘、預(yù)測天氣、勘探石油和加速自動(dòng)駕駛的商用進(jìn)程。
Atlas 900 AI集群也可以提供云服務(wù),以云的方式提供充裕的、經(jīng)濟(jì)的算力資源,簡單易用、高效率、全流程的AI平臺,為客戶帶來極致體驗(yàn)的“易獲取、用得起、方便用”的普惠AI算力。為了讓各行各業(yè)獲取超強(qiáng)算力,華為將Atlas 900部署到云上,推出華為云EI集群服務(wù),并以極優(yōu)惠的價(jià)格,面向全球科研機(jī)構(gòu)和大學(xué),即刻開放申請使用。
“這是計(jì)算產(chǎn)業(yè)新的大航海時(shí)代,我們期待的是千帆競發(fā),而不是獨(dú)舟奮進(jìn)。我們期望和各行各業(yè)的伙伴共同努力,抓住歷史機(jī)遇,共創(chuàng)智能新高度。” 胡厚崑最后強(qiáng)調(diào)。
Atlas 900 代表當(dāng)今全球
算力巔峰
此次發(fā)布的Atlas 900 AI訓(xùn)練集群由數(shù)千顆昇騰910 AI處理器互聯(lián)構(gòu)成,是當(dāng)前全球最快的AI訓(xùn)練集群,代表了當(dāng)今全球的算力巔峰。其總算力達(dá)到256P~1024P FLOPS @FP16,相當(dāng)于50萬臺PC的計(jì)算能力。
除了昇騰910帶來的高性能外,Atlas 900還有四大亮點(diǎn)。
其一是AI算力業(yè)界領(lǐng)先。Atlas 900 AI訓(xùn)練集群采用業(yè)界單芯片算力最強(qiáng)的昇騰910 AI處理器,每顆昇騰910 AI處理器內(nèi)置32個(gè)達(dá)芬奇AI Core,單芯片提供比業(yè)界高一倍的算力。
其二是最佳集群網(wǎng)絡(luò)。Atlas 900 AI訓(xùn)練集群采用“HCCS、 PCIe 4.0、100G以太”三類高速互聯(lián)方式,百TB全互聯(lián)無阻塞專屬參數(shù)同步網(wǎng)絡(luò),降低網(wǎng)絡(luò)時(shí)延,梯度同步時(shí)延縮短10~70%。獨(dú)創(chuàng)iLossless 智能無損交換算法,對集群內(nèi)的網(wǎng)絡(luò)流量進(jìn)行實(shí)時(shí)的學(xué)習(xí)訓(xùn)練,實(shí)現(xiàn)網(wǎng)絡(luò)0丟包與E2E μs級時(shí)延。
其三是系統(tǒng)級調(diào)優(yōu)。Atlas 900 AI訓(xùn)練集群通過華為集合通信庫和作業(yè)調(diào)度平臺,整合HCCS、 PCIe 4.0 和100G RoCE三種高速接口,充分釋放昇騰910 AI處理器的強(qiáng)大性能。華為集合通信庫提供訓(xùn)練網(wǎng)絡(luò)所需的分布式并行庫,通信庫+網(wǎng)絡(luò)拓?fù)?訓(xùn)練算法進(jìn)行系統(tǒng)級調(diào)優(yōu),實(shí)現(xiàn)集群線性度>80%,極大提升了作業(yè)調(diào)度效率。
其四是極致散熱系統(tǒng)。傳統(tǒng)數(shù)據(jù)中心多以風(fēng)冷技術(shù)對設(shè)備進(jìn)行散熱,但在人工智能時(shí)代傳統(tǒng)數(shù)據(jù)中心卻面臨非常大的挑戰(zhàn)。Atlas 900 AI訓(xùn)練集群采用全液冷方案,創(chuàng)新性設(shè)計(jì)業(yè)界最強(qiáng)柜級密閉絕熱技術(shù),支撐>95%液冷占比。單機(jī)柜支持高達(dá)50kW超高散熱功耗,實(shí)現(xiàn)PUE<1.1的極致數(shù)據(jù)中心能源效率。極致的液冷散熱技術(shù)滿足了高功率、高密設(shè)備部署、低PUE的需求,極大地降低了客戶的TCO。
計(jì)算是人類認(rèn)知世界的一種模式。從大型機(jī)到個(gè)人計(jì)算機(jī),從智能手機(jī)到可穿戴設(shè)備,計(jì)算能力日益成為人類能力的延伸。同時(shí),計(jì)算模式也在不斷演進(jìn),基于統(tǒng)計(jì)的計(jì)算模式將逐漸成為主流。預(yù)計(jì)5年后,AI計(jì)算所消耗的算力,將占到算力消耗總量的80%以上,計(jì)算正在進(jìn)入一個(gè)新的智能時(shí)代。