當(dāng)前位置:首頁(yè) > 廠商動(dòng)態(tài) > 廠商文章
[導(dǎo)讀]“AI 一天,人間一年”,一句市場(chǎng)流行語(yǔ)完美闡釋了如今AI大模型的高速發(fā)展和廣泛應(yīng)用。以人們?nèi)粘J褂玫闹悄苁謾C(jī)為例,眾多知名廠商在AI浪潮席卷之下,緊跟AI前沿趨勢(shì),紛紛推出搭載端側(cè)大模型或采用“端云協(xié)同”部署方案的AI手機(jī),促使手機(jī)的智慧化、智能化達(dá)到全新高度,根據(jù)市場(chǎng)調(diào)研機(jī)構(gòu) IDC預(yù)測(cè),2024年全球新一代AI手機(jī)出貨量將達(dá)到1.7億部,占智能手機(jī)總出貨量的15%,體現(xiàn)了AI手機(jī)在電子消費(fèi)市場(chǎng)的廣闊前景。

AI智馭未來(lái),2024邁入存儲(chǔ)元年

“AI 一天,人間一年”,一句市場(chǎng)流行語(yǔ)完美闡釋了如今AI大模型的高速發(fā)展和廣泛應(yīng)用。以人們?nèi)粘J褂玫闹悄苁謾C(jī)為例,眾多知名廠商在AI浪潮席卷之下,緊跟AI前沿趨勢(shì),紛紛推出搭載端側(cè)大模型或采用“端云協(xié)同”部署方案的AI手機(jī),促使手機(jī)的智慧化、智能化達(dá)到全新高度,根據(jù)市場(chǎng)調(diào)研機(jī)構(gòu)IDC預(yù)測(cè),2024年全球新一代AI手機(jī)出貨量將達(dá)到1.7億部,占智能手機(jī)總出貨量的15%,體現(xiàn)了AI手機(jī)在電子消費(fèi)市場(chǎng)的廣闊前景。

除手機(jī)領(lǐng)域外,AI在各類邊緣應(yīng)用落地的趨勢(shì)也愈發(fā)顯著。自ChatGPT橫空出世以來(lái),短短一年多的時(shí)間,生成式AI已悄然滲透至電腦、智能家居乃至汽車等多個(gè)領(lǐng)域,與千行百業(yè)持續(xù)深入融合,迸發(fā)出前所未有的創(chuàng)新活力與應(yīng)用潛力。

釋放邊緣AI潛力,“存力”成關(guān)鍵引擎

生成式AI,尤其是在處理大語(yǔ)言模型和高精度圖像生成任務(wù)時(shí),往往需要龐大的存儲(chǔ)和計(jì)算資源作為支撐。比如在圖像生成方面,創(chuàng)建高分辨率圖像往往伴隨密集的卷積運(yùn)算和反卷積運(yùn)算,而這些運(yùn)算需要高帶寬、高容量的內(nèi)存來(lái)支持?jǐn)?shù)據(jù)的快速傳輸。

因此,龐大的市場(chǎng)機(jī)遇與發(fā)展所帶來(lái)的挑戰(zhàn)總是緊密相依,邊緣設(shè)備在導(dǎo)入生成式AI方面仍面臨著容量、帶寬、能耗和散熱等方面的瓶頸,這些因素深刻影響并制約著邊緣AI的發(fā)展。

具體而言,邊緣設(shè)備導(dǎo)入生成式AI時(shí)通常會(huì)面臨以下瓶頸:

存儲(chǔ)容量限制:以LLamA2 7B大型語(yǔ)言模型為例,即便在優(yōu)化至INT8精度時(shí),也至少需要7GB的內(nèi)存容量來(lái)支撐其運(yùn)行,而在進(jìn)一步壓縮至INT4精度下,內(nèi)存需求仍高達(dá)3.5GB。這意味著多數(shù)現(xiàn)有的邊緣設(shè)備需要進(jìn)行內(nèi)存擴(kuò)容升級(jí),才能實(shí)現(xiàn)模型的本地高效運(yùn)算、顯著降低響應(yīng)延遲;

數(shù)據(jù)傳輸帶寬不足:當(dāng)前主流AI手機(jī)普遍采用LPDDR5內(nèi)存,其帶寬約為68GB/s。未來(lái)LPDDR6的帶寬雖有望達(dá)到150GB/s,但可能仍不足以滿足高端AI應(yīng)用的需求。而HBM雖性能卓越,卻因成本與功耗過(guò)高,難以在邊緣設(shè)備中普及應(yīng)用;

能耗和散熱挑戰(zhàn):運(yùn)行復(fù)雜的生成式AI模型相較一般應(yīng)用會(huì)產(chǎn)生大量計(jì)算熱量。因此,邊緣設(shè)備需要設(shè)計(jì)有效的能源管理和散熱系統(tǒng),以確保設(shè)備運(yùn)行的良好性能和穩(wěn)定性。

CUBE:小號(hào)“HBM”,完美填補(bǔ)市場(chǎng)空缺

目前,AI技術(shù)的深度拓展應(yīng)用在很大程度上仍需要借助云端,這意味著用戶的每次請(qǐng)求指令均需穿越網(wǎng)絡(luò)抵達(dá)云端,才能進(jìn)行復(fù)雜的處理,隨后再將處理結(jié)果反饋至用戶,因此云端通常涉及傳輸延遲、數(shù)據(jù)隱私和效益成本方面的挑戰(zhàn),這大大限制了AI技術(shù)和應(yīng)用的普及廣度。

與云計(jì)算側(cè)重大規(guī)模數(shù)據(jù)處理不同,邊緣計(jì)算的數(shù)據(jù)處理發(fā)生在數(shù)據(jù)源或端點(diǎn)處,因此擁有實(shí)時(shí)處理、分析和決策的快速能力,可大幅降低傳輸延遲性,契合復(fù)雜多變的環(huán)境和任務(wù)處理。因此邊緣AI市場(chǎng)也催生了對(duì)中低容量、超高帶寬及低功耗內(nèi)存解決方案的需求,并且生成式AI的出現(xiàn)也讓存儲(chǔ)行業(yè)催生了新的發(fā)展機(jī)遇——定制化的存儲(chǔ)需求應(yīng)用而生,這主要基于兩大原因:

市場(chǎng)缺乏兼具成本效益與高性能的方案:目前的HBM3E帶寬可達(dá)1.2TB/s,但功耗過(guò)高;雖然LPDDR6帶寬未來(lái)有望超過(guò)150GB/s,但在這二者之間缺乏既能有效控制成本,又能滿足邊緣設(shè)備高性能需求的理想內(nèi)存解決方案;

末級(jí)緩存(Last Level Cache):隨著半導(dǎo)體制程不斷向7nm以下推進(jìn),SRAM微縮效益不再明顯,并且AI運(yùn)算使其容量需求增加,高容量SRAM占據(jù)大面積進(jìn)一步導(dǎo)致成本快速升高。因此,市場(chǎng)上亟需能夠減少SRAM占用面積,降低整體成本的高效解決方案。

為滿足日益增長(zhǎng)的邊緣AI市場(chǎng)需求,助推其高效創(chuàng)新發(fā)展,華邦專門推出CUBE(半定制化超高帶寬元件)產(chǎn)品,大幅優(yōu)化內(nèi)存技術(shù),可實(shí)現(xiàn)在混合云與邊緣云應(yīng)用中運(yùn)行生成式 AI 的性能,為邊緣AI量身定制完美的內(nèi)存解決方案。與市面上現(xiàn)有方案相比,CUBE 的中小容量超高帶寬的特點(diǎn)極具差異化,適用于機(jī)器人、可穿戴設(shè)備、邊緣服務(wù)器等多種高級(jí)應(yīng)用。

CUBE在功耗、性能、尺寸設(shè)計(jì)以及帶寬等領(lǐng)域擁有卓越特性,全方位滿足邊緣AI的發(fā)展需求。在帶寬方面,CUBE能夠達(dá)到 256GB/s – 1TB/s,相當(dāng)于 HBM2或4-32 個(gè) LPDDR4x 4266Mbps x16 IO;并且,CUBE的功耗低于 1pJ/bit,在提供超高帶寬的同時(shí)還可極大減少能源消耗。此外,通過(guò)創(chuàng)新性TSV 技術(shù)以及 uBump/ 混合鍵合,CUBE可降低功耗并節(jié)省 SoC 設(shè)計(jì)面積,從而實(shí)現(xiàn)高效且極具成本效益的解決方案。

整體而言,CUBE 憑借更高的帶寬、更高的能效、更快的響應(yīng)時(shí)間、可定制化特性以及緊湊外形,在釋放 AI應(yīng)用潛力方面發(fā)揮重要作用,能夠讓強(qiáng)大的 AI 從云落地至邊緣設(shè)備和混合云應(yīng)用中。

隨著生成式AI不斷向邊緣端演化,不同應(yīng)用場(chǎng)景下的邊緣端產(chǎn)品數(shù)據(jù)傳輸量攀升,并催生出對(duì)低功耗、高帶寬存儲(chǔ)產(chǎn)品的迫切需求,這一系列新趨勢(shì)為存儲(chǔ)市場(chǎng)開(kāi)辟了廣闊的發(fā)展空間。作為深耕存儲(chǔ)行業(yè)的領(lǐng)導(dǎo)廠商之一,華邦秉持不懈創(chuàng)新、精益求精的發(fā)展理念,持續(xù)開(kāi)發(fā)用于終端產(chǎn)品特定應(yīng)用的DDR4/LPDDR4,此外,華邦還致力于研發(fā)定制化超高帶寬內(nèi)存解決方案,攜手OSAT(半導(dǎo)體封裝測(cè)試)伙伴為邊緣設(shè)備SoC帶來(lái)理想的中小容量超高帶寬內(nèi)存,共同探索內(nèi)存技術(shù)的創(chuàng)新前沿,推動(dòng)邊緣AI實(shí)現(xiàn)更高效、更蓬勃的發(fā)展。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉