當前位置:首頁 > 嵌入式 > 嵌入式新聞
[導讀]近年來,處理器技術(shù)進入如此大,一個像U盤那么大的設(shè)備現(xiàn)在都可以用于為神經(jīng)網(wǎng)絡(luò)提供能量。但是,企業(yè)通常很難充分發(fā)揮其計算能力,因為實施大規(guī)模人工智能過程中還存在的根本挑戰(zhàn)。

近年來,處理器技術(shù)進入如此大,一個像U盤那么大的設(shè)備現(xiàn)在都可以用于為神經(jīng)網(wǎng)絡(luò)提供能量。但是,企業(yè)通常很難充分發(fā)揮其計算能力,因為實施大規(guī)模人工智能過程中還存在的根本挑戰(zhàn)。

 

這個問題和可擴展性有關(guān),本周二IBM發(fā)布了一種名為分布式深度學習(Distributed Deep Learning,DDL)的軟件庫來解決這個問題。深度學習是機器學習的一個子集,旨在教計算機以人類相同的方式進行學習。例如,人們不會通過描述這個生物有4條腿、1個鼻子和1條尾巴的事實來識別出這是一只狗。一旦人們知道狗是什么樣子,就會與貓做永久性的區(qū)分。深度學習試圖在軟件中復(fù)制這種方法。

大多數(shù)深度學習的框架都支持跨多個服務(wù)器擴展大型模式的能力,很多現(xiàn)在也支持GPU,但是收集和同步分析結(jié)果的方式還遠遠不夠,IBM研究部門總監(jiān)Hillery Hunter表示。

同步的工作流

深度學習模式運行在計算機集群上,通過GPU進行增強,GPU芯片有數(shù)百萬個分布式和互相關(guān)聯(lián)的處理元素,其作用大致類似于人類大腦中的神經(jīng)元。這些人造神經(jīng)元一起處理信息,就像人類的部分一樣,每個神經(jīng)元都處理一小部分數(shù)據(jù)。當節(jié)點完成計算的時候,結(jié)果將同步在其他神經(jīng)網(wǎng)絡(luò)上,以幫助協(xié)調(diào)工作。

在IBM看來,這就是瓶頸所在。人造神經(jīng)元部署運行在越快的GPU上,完成計算的速度就越快,意味著結(jié)果的同步更加頻繁。由于AI集群的構(gòu)建方式,如果環(huán)境中芯片的數(shù)量增加,同樣適用。但是深度學習框架只能頻繁地同步數(shù)據(jù)。

因此,處理速度收到了數(shù)據(jù)在GPU之間傳輸?shù)南拗?。DDL利用所謂的多層通信算法來改變這一平衡。這個軟件庫修改信息發(fā)送通過的網(wǎng)絡(luò)路徑,以實現(xiàn)延遲和帶寬之間“最優(yōu)化”的平衡,讓通信不再是主要的瓶頸。

創(chuàng)紀錄的性能

在一次內(nèi)部測試中,IBM在一個有數(shù)百個GPU的集群上部署了DDL,并從一個受歡迎的研究數(shù)據(jù)集中發(fā)送處理750萬個圖像,將其分到22000個分類中的一個或者多個。該模型在經(jīng)過7個小時的訓練之后,可準確識別33.8%的對象,打包了之前微軟在經(jīng)過10天訓練之后創(chuàng)下的29.8%的紀錄。

如果4%的改進聽起來不足為奇,而且整體成功率還比較低,這是因為這個模型遠比現(xiàn)實中遇到的更為復(fù)雜,IBM高性能計算及人工智能副總裁Sumit Gupta表示。所以改進是循序漸進的,他指出,微軟此前的紀錄只比上一次改進了0.8%。這個基準測試旨在強調(diào)深度學習軟件,以證明研究人員真正構(gòu)建了更好的模型。

DDL在訓練人工智能開發(fā)的過程中尤其有用,這是整個項目生命中其中占用時間最長的之一。有時候模型需要花費幾周甚至幾個月的時間來處理樣品數(shù)據(jù),才能變得足夠準確用于生產(chǎn)中。IBM稱,在某些情況下IBM的軟件庫可以將這個過程縮短至幾個小時。“如果需要16天時間訓練一個模型如何識別新的信用卡,那么這16天你就是在虧本的。”

深度學習在醫(yī)療場景中也很有用,例如組織分析,長時間的訓練關(guān)于生存或者死亡的問題。此外還有其他好處,如果一個深度學習模型可以在數(shù)小時而不是數(shù)周時間內(nèi)完成訓練,那么就能釋放企業(yè)的人工智能基礎(chǔ)設(shè)施,用于更快地完成其他項目和其他工作。

IBM還另外展示了如何利用DDL實現(xiàn)95%的擴展效率,相比之下Facebook在此前的測試中記錄是89%。這兩個測試都使用了相同的樣本數(shù)據(jù)。

IBM表示,DDL幫助企業(yè)培訓他們的模型,實現(xiàn)此前由于時間限制而無法實現(xiàn)的速度和范圍。它將DDL軟件庫與所有主流深度學習框架相連接,包括TensorFlow、Caffee、Chainer、Torch和Theano,都是在一個開源許可下的。

IBM還將這個軟件庫融入到自己的PowerAI深度學習共計套件平臺中,有免費和付費企業(yè)兩個版本,此外還有在Minbix Minsky Power Cloud上。Gupta表示:“我們將通過PowerAI把它帶給每個人。”

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉