HBM2E和GDDR6 助力新一輪人工智能應(yīng)用浪潮
當(dāng)前,隨著人工智能/機器學(xué)習(xí)(AI/ML)的極速興起,智能技術(shù)正被廣泛應(yīng)用于制造業(yè)、交通、醫(yī)療、教育和金融等各個領(lǐng)域,人工智能將掀起下一次工業(yè)革命。
中國作為全球人工智能發(fā)展最快的國家之一,正備受矚目。根據(jù)德勤最新發(fā)布的統(tǒng)計預(yù)測數(shù)據(jù)顯示,2020年全球人工智能市場規(guī)模將達到6800億元人民幣,復(fù)合增長率(CAGR)達26%。而中國人工智能市場的表現(xiàn)尤為突出,到2020年市場規(guī)模預(yù)計將達到710億元人民幣,自2015年至2020年,五年間的復(fù)合增長率高達44.5%。
近年來,中國正在積極推動人工智能與實體經(jīng)濟的融合,從而實現(xiàn)產(chǎn)業(yè)的優(yōu)化升級。2017年7月,國務(wù)院印發(fā)了《新一代人工智能發(fā)展規(guī)劃》,這一規(guī)劃與2015年5月發(fā)布的《中國制造2025》共同構(gòu)成了中國人工智能戰(zhàn)略的核心。這份具有里程碑意義的規(guī)劃,對人工智能發(fā)展進行了戰(zhàn)略性部署,力爭到2030年把中國建設(shè)成為世界主要人工智能創(chuàng)新中心。此外,2020年是中國的新基建元年,而人工智能作為一大重點板塊,勢必成為新基建的核心支撐。
在此背景下, 中國人工智能產(chǎn)業(yè)規(guī)模在2019年末達到510億元人民幣,其中人工智能企業(yè)超過2600家。隨著中國加速推進人工智能應(yīng)用以引領(lǐng)經(jīng)濟增長,這一趨勢將推動計算機硬件和軟件各方面的快速發(fā)展。
Rambus在最新發(fā)布的白皮書中探討了內(nèi)存帶寬對AI/ML的重要作用,特別介紹了HBM2E和GDDR6內(nèi)存優(yōu)勢和設(shè)計注意事項。白皮書還解釋了每種內(nèi)存在整個AI/ML架構(gòu)中的適用性,以及如何利用Rambus HBM2E和GDDR6接口解決方案來實現(xiàn)一個完整的內(nèi)存子系統(tǒng)。以下是白皮書的一些重要內(nèi)容:
AI/ML步入高速發(fā)展期
作為AI/ML的關(guān)鍵應(yīng)用場景,訓(xùn)練與推理能力的發(fā)展,從某種程度上代表著人工智能的高速發(fā)展。從2012年到2019年,人工智能訓(xùn)練集增長了30萬倍,要求人工智能計算機硬件和軟件的各個方面都需要不斷的快速改進。與此同時,人工智能推理正在網(wǎng)絡(luò)邊緣和廣泛的物聯(lián)網(wǎng)設(shè)備中采用,包括在汽車/ADAS中。
支持這一發(fā)展速度需要的遠(yuǎn)不止摩爾定律所能實現(xiàn)的改進,摩爾定律在任何情況下都在放緩,這就要求人工智能計算機硬件和軟件的各個方面都需要不斷的快速改進。
內(nèi)存帶寬是影響AI發(fā)展的關(guān)鍵因素
內(nèi)存帶寬將成為人工智能持續(xù)增長的關(guān)鍵焦點領(lǐng)域之一。以先進的駕駛員輔助系統(tǒng)(ADAS)為例,第3級及更高級別系統(tǒng)的復(fù)雜數(shù)據(jù)處理需要超過200 GB/s的內(nèi)存帶寬。這些高帶寬是復(fù)雜的AI/ML算法的基本需求,在道路上自駕過程中這些算法需要快速執(zhí)行大量計算并安全地執(zhí)行實時決策。在第5級,即完全自主駕駛,車輛能夠獨立地對交通標(biāo)志和信號的動態(tài)環(huán)境作出反應(yīng),以及準(zhǔn)確地預(yù)測汽車、卡車、自行車和行人的移動,將需要超過500GB/s的內(nèi)存帶寬。
隨著新一代AI/ML加速器和專用芯片的快速發(fā)展,新的內(nèi)存解決方案,如高帶寬內(nèi)存(HBM、HBM2、HBM2E)和GDDR6 SDRAM(GDDR6)漸被采用來提供所需的帶寬。
HBM2E和GDDR6助力新一輪人工智能應(yīng)用浪潮
鑒于AI/ML的需求分流的特性,內(nèi)存的選擇取決于應(yīng)用:訓(xùn)練還是推理。HBM2E和GDDR6這兩種高帶寬內(nèi)存,都可以起到至關(guān)重要的作用。
對于訓(xùn)練來說,帶寬和容量是至關(guān)重要的需求。特別是考慮到訓(xùn)練集的規(guī)模正以每3.43個月翻一番的速度增長。此外,在數(shù)據(jù)中心運行的訓(xùn)練應(yīng)用程序因電源和空間所致的限制越來越大,因此有一個提供更佳能效和更小尺寸的解決方案是一大加分??紤]到所有這些需求,HBM2E是AI訓(xùn)練硬件的理想內(nèi)存解決方案。
在推理的情況下,帶寬和延遲對于實時操作的需求至關(guān)重要。對于人工智能推理這一日益具有挑戰(zhàn)性的領(lǐng)域,GDDR6是一個理想的解決方案。建立在成熟的制造工藝基礎(chǔ)上,其出色的性價比使其適合廣泛的采用。
Rambus提供全面且現(xiàn)成的HBM2E和GDDR6內(nèi)存接口解決方案,可集成到AI/ML訓(xùn)練和推理SoCs中。最近,該公司的 HBM2E內(nèi)存接口解決方案實現(xiàn)了創(chuàng)紀(jì)錄的4 Gbps性能。該解決方案由完全集成的PHY和控制器組成,搭配業(yè)界最快的,來自SK hynix的3.6Gbps運行速度的HBM2E DRAM,該解決方案可以從單個HBM2E設(shè)備提供460 GB/s的帶寬。此性能可以滿足TB級的帶寬需求,針對最苛刻和最先進的AI/ML訓(xùn)練和高性能的加速器計算(HPC)應(yīng)用而生。
總的來說,訓(xùn)練和推理有其獨特的應(yīng)用需求,可以通過定制內(nèi)存解決方案來支持。HBM2E是AI訓(xùn)練的理想選擇,GDDR6是AI推理的理想選擇。設(shè)計師可以通過與Rambus合作來克服這些架構(gòu)中固有的設(shè)計挑戰(zhàn),從而實現(xiàn)這些高性能內(nèi)存的長處。