全球訓練速度最快集群Atlas900曝光 華為計算產(chǎn)業(yè)戰(zhàn)略全公布
華為全聯(lián)接大會主論壇門前的展示牌
9月18日,一年一度的華為全聯(lián)接大會在世博會展館開幕,主論壇前“AI巔峰,即將揭曉”的展示牌昭示本屆大會的主題,更彰顯著華為的野心與底氣。
去年的全聯(lián)接大會上,華為首次對外發(fā)布其AI發(fā)展戰(zhàn)略以及全棧全場景AI解決方案,兩款AI芯片昇騰910和310也吸引了不少關注,今年是華為AI戰(zhàn)略的延續(xù),華為副董事長、輪值董事長胡厚崑主要從兩方面做闡述:
算力目前仍然是人工智能產(chǎn)業(yè)的基礎——大會發(fā)布了華為的計算產(chǎn)業(yè)戰(zhàn)略;
從技術和應用場景出發(fā)人工智能產(chǎn)業(yè)更新——大會分享了華為全棧全場景AI重大進展;
胡厚崑率先開場做主題為《共創(chuàng)智能新高度》的演講,他提到,華為過去半年頂著巨大的壓力,但華為目前的狀態(tài)還不錯,“如上海的天氣,秋高氣爽,云淡風輕”。
胡厚崑表示,智能世界的兩大關鍵技術,聯(lián)接和計算同樣重要,相互促進,密不可分,華為在計算方面的投入超過十年。
華為觀察到,計算機的體積越來越小,功能越來越強大,更重要地,計算機和人的距離越來越近,計算能力已經(jīng)成為人的能力的一種延伸,沿著這樣的趨勢走下去,華為相信計算產(chǎn)業(yè)的發(fā)展前景是不可限量的。
計算模式本身也在不斷演進,從1960年代基于規(guī)則的計算,以CPU為代表,到2010年代基于統(tǒng)計的計算,以NPU為代表,而未來,華為預測,基于統(tǒng)計的計算將會成為計算主流,消耗的算力有可能占據(jù)社會總算力的80%。
“計算正進入智能時代”,胡厚崑表示,計算進入智能時代有三個特征,其一,基于統(tǒng)計的計算就是一種“暴力計算”,高度依賴算力;
其二,計算和智能將會無處不在,而不僅僅是分布在中心側。從中心節(jié)點的暴力計算,到邊緣側的專業(yè)計算,如基因測序,以及端側的個性計算,如耳機、手機,一起構成了未來智能時代的計算形態(tài);
其三,端邊云協(xié)同,從中心側到邊緣側到端側,邊端云需要更好的協(xié)同,在華為看來,中心節(jié)點主要負責暴力計算,通用模型在中心節(jié)點計算完之后,復制到邊和端,為端側的個性化計算和邊緣側的專業(yè)化計算提供支持。
“未來十年是計算產(chǎn)業(yè)黃金十年,雖然有很多困難,但也是巨大的新藍海。”
華為計算產(chǎn)業(yè)戰(zhàn)略正式發(fā)布:架構創(chuàng)新、投資全場景處理器族、商業(yè)策略“有所為有所不為”、構建開放生態(tài)。
架構創(chuàng)新:達芬奇架構胡厚崑提到,在摩爾定律幾乎已經(jīng)走到極限的情況下,行業(yè)需要新架構,達芬奇架構誕生是自然選擇,到目前為止,達芬奇計算架構是業(yè)界唯一能夠覆蓋“端、邊、云”全場景的處理器架構。
投資全場景處理器族:鯤鵬、昇騰、麒麟、鴻鵠華為目前的處理器族已有四族,具體包括支持通用計算的鯤鵬系列,支持AI的昇騰系列,支持智能終端的麒麟系列,以及支持智慧屏的鴻鵠系列。胡厚崑表示,華為未來將持續(xù)不斷地對處理器進行投資,將來還將推出一系列處理器,面向更多的場景。
商業(yè)策略“有所為有所不為”首先是硬件開放,不對外銷售處理器,主要以云服務方式,開放部件和板卡等,全力支持合作伙伴做好整機。
然后是軟件開源,華為將于硬件搭配的服務器操作系統(tǒng)、數(shù)據(jù)庫、AI開發(fā)框架等軟件開源,幫助伙伴做好商用版本,讓軟件開發(fā)更簡單。
最后是使能應用開發(fā)和遷移,華為不做應用但是會幫助合作伙伴做應用的開發(fā)和遷移。
構建開放生態(tài):沃土計劃延續(xù)計算產(chǎn)業(yè)的發(fā)展高度依賴生態(tài)。自華為沃土計劃發(fā)布后,四年來發(fā)展得非常好,目前已匯聚130多萬開發(fā)者和14000多家ISV。新一輪計劃投入15億美元資金,希望擴大到500萬開發(fā)者規(guī)模。
在通用計算領域,華為投資鯤鵬系列希望打造有競爭力的通用計算處理器。在此基礎上,華為不斷地對板卡、服務器、操作系統(tǒng)、數(shù)據(jù)庫、編譯器等關鍵技術和產(chǎn)品進行投資,希望通過強力投資,打通生態(tài)全鏈條,讓合作伙伴更有信心、更堅定地參與打造鯤鵬產(chǎn)業(yè)。
在全國范圍內(nèi),鯤鵬產(chǎn)業(yè)生態(tài)基地已經(jīng)落地北京、上海、深圳等城市。華為與各地的政府、合作伙伴一起,結合當?shù)氐膬?yōu)勢,打造鯤鵬計算產(chǎn)業(yè)的創(chuàng)新基地和孵化平臺。以平臺為載體,聚合生態(tài)伙伴,開展應用示范,培養(yǎng)產(chǎn)業(yè)人才,孵化產(chǎn)業(yè)標準。
全棧全場景AI重大進展
去年的全棧全場景解決方案發(fā)布,但是只有部分落地,也引起了開發(fā)者和合作伙伴的擔憂,今年則是全面落地。
現(xiàn)場進一步發(fā)布了華為AI全棧全場景重磅產(chǎn)品——昇騰910服務器集群Atlas900,華為稱之為目前世界上訓練速度最快的訓練集群,在Fastest cluster ResNst-50@ImageNet測試中,華為成績?yōu)?9.8秒,比第二名70.2秒的成績高出了10秒多。
Atlas900由數(shù)千顆昇騰910 AI處理器互聯(lián)構成,每顆昇騰910 AI處理器內(nèi)置32個達芬奇AI Core,單芯片提供比業(yè)界高一倍的算力(256TFLOPS@FP16),總算力達到256P~1024P FLOPS @FP16。
Atlas 900 AI訓練集群采用“HCCS、 PCIe 4.0、100G以太”三類高速互聯(lián)方式,在AI服務器內(nèi)部,昇騰910 AI處理器之間通過HCCS高速總線互聯(lián);昇騰910 AI處理器和CPU之間以最新的PCIe 4.0(速率16Gb/s)技術互聯(lián),其速率是業(yè)界主流采用的PCIe 3.0(8.0Gb/s)技術的兩倍;在集群層面,采用面向數(shù)據(jù)中心的CloudEngine 8800系列交換機,提供單端口100Gbps的交換速率。
Atlas 900 AI訓練集群采用全液冷方案,支撐>95%液冷占比。單機柜支持高達50kW超高散熱功耗,實現(xiàn)PUE<1.1的極致數(shù)據(jù)中心能源效率。另外,在空間節(jié)省方面,與8kw風冷機柜相比,節(jié)省機房空間79%。
華為現(xiàn)場介紹了天文案例,天文研究高度依賴于海量的數(shù)據(jù)分析和計算,離不開超強算力支持。
華為聯(lián)合上海天文臺與SKA共同打造的,一張南半球的星空圖有20萬顆星星,當前條件下,天文學家要從這20萬顆星星中,找出某種特征的星體,相當困難,需要169天的工作量?,F(xiàn)在用上Atlas 900,只用10秒,就從20萬顆星星中檢索出了相應特征的星體。
胡厚崑在現(xiàn)場宣布,為了讓大家馬上就能用上Atlas 900的超強算力,華為已經(jīng)把它部署到華為云上,并以極優(yōu)惠的價格向全球科研機構和大學開放,歡迎大家申請使用。
在發(fā)言的最后,胡厚崑表示,華為選擇了計算架構和處理器的開發(fā)這兩個最難的方面入手,他提到,華為的基因是,愿意且善于走遠路的公司,用最好的技術解決最難的問題。
“我們堅信,只有克服最大的困難,才能真正構建起競爭力,才能為行業(yè)伙伴打開更大的產(chǎn)業(yè)空間,我們要用最好的技術,解決世界上最難的問題,把不可能變成可能。這是計算產(chǎn)業(yè)新的大航海時代,我們期待的是千帆競發(fā),而不是獨舟奮進。我們期望和各行各業(yè)的伙伴共同努力,抓住歷史機遇,共創(chuàng)智能新高度“,胡厚崑代表華為發(fā)出了產(chǎn)業(yè)強音。記者記者(公眾號:記者)記者
相關文章:
華為方舟編譯器正式開源,脫離 GitHub 實現(xiàn)自主托管
華為發(fā)布首款旗艦5G SoC麒麟990,強大AI性能支持攝像頭測心率
華為鯤鵬產(chǎn)業(yè)生態(tài)創(chuàng)新中心落戶上海