當(dāng)前位置:首頁 > 工業(yè)控制 > 工業(yè)控制技術(shù)文庫
[導(dǎo)讀] 人工智能在機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中的“復(fù)活”導(dǎo)致相關(guān)研究和產(chǎn)品開發(fā)的爆炸式增長,因?yàn)槠髽I(yè)發(fā)現(xiàn)了創(chuàng)新性方法來將這些新算法用于流程自動(dòng)化和預(yù)測性見解。從機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型(后者通常涉及模擬大腦的神經(jīng)

人工智能在機(jī)器學(xué)習(xí)深度學(xué)習(xí)中的“復(fù)活”導(dǎo)致相關(guān)研究和產(chǎn)品開發(fā)的爆炸式增長,因?yàn)槠髽I(yè)發(fā)現(xiàn)了創(chuàng)新性方法來將這些新算法用于流程自動(dòng)化和預(yù)測性見解。從機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型(后者通常涉及模擬大腦的神經(jīng)結(jié)構(gòu)和連通性)的性質(zhì)來看,它們通常需要獲取、準(zhǔn)備、移動(dòng)和處理海量數(shù)據(jù)集。?

特別是,深度學(xué)習(xí)模型需要大量數(shù)據(jù)集。人工智能(特別是深度學(xué)習(xí))的數(shù)據(jù)存儲(chǔ)給企業(yè)帶來獨(dú)特的挑戰(zhàn)。下面我們將簡要探討機(jī)器學(xué)習(xí)和深度學(xué)習(xí)軟件的性質(zhì),而這將揭示存儲(chǔ)系統(tǒng)對(duì)于這些算法的重要性,以確保它們提供及時(shí)準(zhǔn)確的結(jié)果。
?

為什么AI和深度學(xué)習(xí)存儲(chǔ)很重要?

很多研究人員已經(jīng)證明,深度學(xué)習(xí)模型的準(zhǔn)確性會(huì)隨著數(shù)據(jù)集的增加而提高。這種準(zhǔn)確性的提高非常重要,以至于研究人員經(jīng)常會(huì)使用復(fù)雜的數(shù)據(jù)增強(qiáng)技術(shù)來綜合地生成額外數(shù)據(jù)用于訓(xùn)練模型。

例如,ImageNet項(xiàng)目的數(shù)據(jù)集包含超過1400萬張具有一百萬個(gè)注釋的圖像,這些數(shù)據(jù)集被用于對(duì)各種深度學(xué)習(xí)圖像分類算法進(jìn)行基準(zhǔn)測試。同時(shí),對(duì)圖像分類硬件進(jìn)行基準(zhǔn)測試的ResNet-50模型通常會(huì)超過100 MB。理想情況下,這些模型保存在內(nèi)存中,它們需要源源不斷的數(shù)據(jù),而這通常會(huì)導(dǎo)致存儲(chǔ)系統(tǒng)成為整體性能的瓶頸。?

無論使用什么模型和應(yīng)用程序,深度學(xué)習(xí)都包括兩個(gè)步驟:模型訓(xùn)練和數(shù)據(jù)推理。模型訓(xùn)練是指,通過利用訓(xùn)練數(shù)據(jù)集,基于重復(fù)(通常是遞歸)計(jì)算以計(jì)算和優(yōu)化模型參數(shù)的過程。數(shù)據(jù)推斷是指利用已經(jīng)過訓(xùn)練的模型對(duì)新傳入數(shù)據(jù)進(jìn)行分類和預(yù)測。?

對(duì)于為AI和深度學(xué)習(xí)提供存儲(chǔ)的系統(tǒng)而言,每個(gè)步驟都會(huì)以不同方式帶來壓力。對(duì)于模型訓(xùn)練,壓力源于大數(shù)據(jù)集以及快速I/O—以提供可接受性能,這里的計(jì)算涉及分布式集群。而對(duì)于推理,壓力來自必須以最小延遲實(shí)時(shí)處理數(shù)據(jù)。

深度學(xué)習(xí)的存儲(chǔ)性能需求

深度學(xué)習(xí)算法的性質(zhì)意味著它們會(huì)使用大量矩陣數(shù)學(xué),這使它們非常適合GPU上的執(zhí)行,GPU最初設(shè)計(jì)用于對(duì)像素?cái)?shù)據(jù)進(jìn)行數(shù)千個(gè)同步浮點(diǎn)計(jì)算。與計(jì)算機(jī)圖形不同,神經(jīng)網(wǎng)絡(luò)和其他深度學(xué)習(xí)模型不需要高精度浮點(diǎn)結(jié)果,并且新一代AI優(yōu)化的GPU和CPU(支持低精度8位和16位矩陣計(jì)算)使這些模型進(jìn)一步加速,這種優(yōu)化會(huì)使將存儲(chǔ)系統(tǒng)變成更大的性能瓶頸。

深度學(xué)習(xí)模型和數(shù)據(jù)源的多樣性,以及深度學(xué)習(xí)服務(wù)器通常采用的分布式計(jì)算設(shè)計(jì),意味著旨在為AI提供存儲(chǔ)的系統(tǒng)必須解決以下問題:

1.各種數(shù)據(jù)格式,包括二進(jìn)制大型對(duì)象(BLOB)數(shù)據(jù)、圖像、視頻、音頻、文本和結(jié)構(gòu)化數(shù)據(jù),它們具有不同的格式和I / O特性。?

2.橫向擴(kuò)展系統(tǒng)架構(gòu),其中工作負(fù)載分布在多個(gè)系統(tǒng)中,通常有4到16個(gè)用于訓(xùn)練,可能有數(shù)百個(gè)或數(shù)千個(gè)用于推理。?

3.帶寬和吞吐量,可以快速向計(jì)算硬件提供大量數(shù)據(jù)。?

4.OPS,無論數(shù)據(jù)特性如何,IOPS都能維持高吞吐量;這就是說,適用于很多小型傳輸和較少的大量傳輸。?

5.延遲性,以最小延遲提供數(shù)據(jù),因?yàn)榕c虛擬內(nèi)存分頁一樣,當(dāng)GPU等待新數(shù)據(jù)時(shí),訓(xùn)練算法的性能會(huì)顯著降低。

深度學(xué)習(xí)存儲(chǔ)系統(tǒng)設(shè)計(jì)必須可跨各種數(shù)據(jù)類型和深度學(xué)習(xí)模型提供均衡的性能。根據(jù)Nvidia工程師的說法,在各種負(fù)載條件下驗(yàn)證存儲(chǔ)系統(tǒng)性能至關(guān)重要。他寫道:

“工作負(fù)載的復(fù)雜性加上深度學(xué)習(xí)訓(xùn)練所需的數(shù)據(jù)量,帶來一個(gè)具有挑戰(zhàn)性的性能環(huán)境….考慮到這些環(huán)境的復(fù)雜性,重要的是,在投入生產(chǎn)之前應(yīng)收集基準(zhǔn)性能數(shù)據(jù),驗(yàn)證核心系統(tǒng)(硬件組件和操作系統(tǒng))在合成負(fù)載下可提供預(yù)期的性能。”

深度學(xué)習(xí)存儲(chǔ)系統(tǒng)的核心功能

上述性能因素已推動(dòng)AI存儲(chǔ)系統(tǒng)供應(yīng)商部署五個(gè)核心功能,包括:

1.并行的橫向擴(kuò)展系統(tǒng)設(shè)計(jì),可逐步擴(kuò)展且I / O性能隨容量擴(kuò)展。這種設(shè)計(jì)的標(biāo)志是分布式存儲(chǔ)架構(gòu)或文件系統(tǒng),這些系統(tǒng)將邏輯組件(例如對(duì)象和文件)從物理設(shè)備分離。

2.可編程的軟件定義控制平面,這是實(shí)現(xiàn)橫向擴(kuò)展設(shè)計(jì)以及自動(dòng)化大多數(shù)管理任務(wù)的關(guān)鍵。

3.企業(yè)級(jí)可靠性、耐用性、冗余和存儲(chǔ)服務(wù)。

4.對(duì)于深度學(xué)習(xí)訓(xùn)練系統(tǒng),緊密耦合的計(jì)算存儲(chǔ)系統(tǒng)架構(gòu),具有無阻塞網(wǎng)絡(luò)設(shè)計(jì)可連接服務(wù)器和存儲(chǔ),以及最低鏈路速度為10 Gb至25 Gb以太網(wǎng)或EDR(25 Gbps)InfiniBand。

5.SSD設(shè)備越來越多地使用更快的NVMe設(shè)備,可提供比SATA更高的吞吐量和IOPS。

DAS系統(tǒng)通常使用NVMe-over-PCIe設(shè)備

NAS設(shè)計(jì)通常使用10 Gb或更快的以太網(wǎng),使用NVMe over fabric、Infiniband或交換PCIe架構(gòu)。

量身定制的存儲(chǔ)產(chǎn)品

AI現(xiàn)在是一項(xiàng)熱門技術(shù),供應(yīng)商們都紛紛快速向市場推出新產(chǎn)品和更新產(chǎn)品,以滿足AI工作負(fù)載的需求。鑒于這種市場活力,我們不會(huì)試圖提供AI存儲(chǔ)產(chǎn)品的綜合目錄,但以下是一些示例:

Dell EMC Ready Solutions for AI ,具有機(jī)架規(guī)模捆綁包,其中封裝有服務(wù)器、存儲(chǔ),邊緣交換機(jī)和管理節(jié)點(diǎn)。該存儲(chǔ)使用具有40 GbE網(wǎng)絡(luò)鏈路的Isilon H600或F800全閃存擴(kuò)展NAS。

DDN A3I?使用AI200或AI400 NVMe全閃存陣列(AFA),分別具有360 TB容量和750K和1.5M IOPS,以及4或8個(gè)100 GbE或EDR InfiniBand接口,或DDN AI7990混合存儲(chǔ)設(shè)備-具有5.4 PB容量、750K IOPS和4個(gè)100 GbE或EDR InfiniBand接口。DDN的產(chǎn)品還有捆綁Nvidia DGX-1 GPU加速服務(wù)器和Hewlett Packard Enterprise Apollo 6500加速服務(wù)器。

IBM ElasTIc Storage Server AFA具有多種基于SSD的配置,可提供高達(dá)1.1 PB的可用容量。IBM還有一個(gè)參考系統(tǒng)架構(gòu),其中整合了ElasTIc Storage Server與Power Systems服務(wù)器和PowerAI Enterprise軟件堆棧。

NetApp OnTap AI參考架構(gòu)將Nvidia DGX-1服務(wù)器與NetApp AFA A800系統(tǒng)和兩個(gè)Cisco Nexus 3K 100 GbE交換機(jī)相結(jié)合。A800可提供1M的IOPS,延遲時(shí)間為半毫秒,同時(shí),其橫向擴(kuò)展設(shè)計(jì)可在24節(jié)點(diǎn)集群中提供超過11M的IOPS。

Pure Storage AIRI是另一個(gè)DGX-1集成系統(tǒng),它使用Pure的FlashBlade AFA系統(tǒng),支持文件和對(duì)象存儲(chǔ)。參考系統(tǒng)可用于Arista、思科或Mellanox交換機(jī)。例如,一個(gè)Arista設(shè)計(jì)使用15個(gè)17 TB FlashBlades,具有8個(gè)40 GbE鏈路連接到Arista 32端口100 GbE交換機(jī)。

深度學(xué)習(xí)推理系統(tǒng)對(duì)存儲(chǔ)子系統(tǒng)的要求較低,并且,通??赏ㄟ^在x86服務(wù)器中使用本地SSD來實(shí)現(xiàn)。雖然推理平臺(tái)通常是具有本地SSD或NVMe插槽的傳統(tǒng)1U和2U服務(wù)器設(shè)計(jì),但現(xiàn)在它們越來越多地包括計(jì)算加速器,例如Nvidia T4 GPU或FPGA,這些加速器可以將一些深度學(xué)習(xí)操作編譯到硬件的。

(來源:TechTarget中國)

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉