當(dāng)前位置:首頁(yè) > 芯聞號(hào) > 美通社全球TMT
[導(dǎo)讀]新聞要點(diǎn): 新一代IBM Telum II 處理器和 IBM Spyre 加速器可解鎖更多企業(yè)級(jí) AI 能力,包括大語(yǔ)言模型和生成式 AI 先進(jìn)的 I/O 技術(shù)實(shí)現(xiàn)并簡(jiǎn)化可擴(kuò)展的 I/O 子系統(tǒng),進(jìn)一步降低能耗和數(shù)據(jù)中心占地面積 北京2024年8月29日 /美通...

新聞要點(diǎn):

  • 新一代IBM Telum II 處理器和 IBM Spyre 加速器可解鎖更多企業(yè)級(jí) AI 能力,包括大語(yǔ)言模型和生成式 AI
  • 先進(jìn)的 I/O 技術(shù)實(shí)現(xiàn)并簡(jiǎn)化可擴(kuò)展的 I/O 子系統(tǒng),進(jìn)一步降低能耗和數(shù)據(jù)中心占地面積

北京2024年8月29日 /美通社/ -- 近日,IBM(紐約證券交易所:IBM)在 Hot Chips 2024大會(huì)上公布了即將推出的 IBM Telum? II 處理器和 IBM Spyre? 加速器的架構(gòu)細(xì)節(jié)。這些新技術(shù)旨在大幅擴(kuò)展下一代 IBM Z 大型主機(jī)系統(tǒng)的處理能力,通過(guò)新的 AI 集成方法,加速企業(yè)對(duì)傳統(tǒng) AI 模型和大語(yǔ)言 AI 模型的協(xié)同使用。

IBM 推出全新Telum處理器,依托新一代 IBM Z 大型主機(jī)加速 AI 應(yīng)用

IBM 推出全新Telum處理器,依托新一代 IBM Z 大型主機(jī)加速 AI 應(yīng)用

隨著基于大語(yǔ)言模型的 AI 項(xiàng)目從概念驗(yàn)證階段進(jìn)入生產(chǎn)階段,企業(yè)對(duì)高能效、高安全性和高度可擴(kuò)展解決方案的需求日益迫切。摩根士丹利最近發(fā)布的一份研究報(bào)告預(yù)測(cè),在未來(lái)幾年,生成式 AI 的電力需求將以每年 75% 的速度激增,其 2026 年的能耗或?qū)⑴c西班牙 2022 年的全年能耗相當(dāng)。許多 IBM 客戶(hù)表示,支持適當(dāng)規(guī)模的基礎(chǔ)模型和針對(duì) AI 工作負(fù)載的混合架構(gòu)越來(lái)越重要。

此次IBM發(fā)布的主要?jiǎng)?chuàng)新技術(shù)包括:

  • IBM Telum II 處理器:這一全新芯片將搭載于下一代 IBM Z 系列主機(jī),與第一代 Telum 芯片相比,其頻率和內(nèi)存容量均有提升,高速緩存提升40%;集成 AI 加速器內(nèi)核和數(shù)據(jù)處理單元 (DPU) 的性能也得到改善。IBM Telum II處理器將支持大語(yǔ)言模型驅(qū)動(dòng)的企業(yè)計(jì)算解決方案,滿(mǎn)足金融等行業(yè)的復(fù)雜交易需求。
  • IO 加速單元:Telum II 處理器芯片上的全新數(shù)據(jù)處理單元 (DPU) 旨在加速大型主機(jī)上用于聯(lián)網(wǎng)和數(shù)據(jù)存儲(chǔ)的復(fù)雜 IO 協(xié)議,可簡(jiǎn)化系統(tǒng)操作,提高關(guān)鍵組件性能。
  • IBM Spyre加速器:可提供額外的AI計(jì)算能力,與 Telum II 處理器相得益彰。Telum II 和 Spyre 芯片共同構(gòu)成了一個(gè)可擴(kuò)展的架構(gòu),可支持AI集成建模方法,即將多個(gè)機(jī)器學(xué)習(xí)或深度學(xué)習(xí)的AI模型與基于編碼器的大語(yǔ)言模型相結(jié)合。通過(guò)利用每個(gè)模型架構(gòu)的優(yōu)勢(shì),AI集成的方法可以生成比單個(gè)模型更準(zhǔn)確、更穩(wěn)健的結(jié)果。Spyre 加速器芯片在 Hot Chips 2024 大會(huì)期間進(jìn)行了預(yù)覽,并將作為T(mén)elum II 處理器的附加選件提供。每個(gè)加速器芯片均與IBM 研究院合作開(kāi)發(fā),通過(guò)一個(gè) 75 瓦 PCIe 適配器連接。與其他 PCIe 卡一樣,Spyre 加速器可根據(jù)客戶(hù)需求進(jìn)行擴(kuò)展。

IBM主機(jī)和 LinuxONE 產(chǎn)品管理副總裁 Tina Tarquinio 表示:"得益于IBM強(qiáng)大的多代并行的開(kāi)發(fā)路線(xiàn)圖,我們得以在保持技術(shù)領(lǐng)先的同時(shí),滿(mǎn)足企業(yè)不斷升級(jí)的 AI 需求。Telum II 處理器和 Spyre 加速器旨在提供安全、節(jié)能、高性能的企業(yè)計(jì)算解決方案。這些多年研發(fā)的創(chuàng)新成果將被引入下一代 IBM Z 平臺(tái),幫助客戶(hù)大規(guī)模利用大語(yǔ)言模型和生成式 AI技術(shù)。"

Telum II 處理器和 IBM Spyre 加速器將由 IBM 的長(zhǎng)期合作伙伴三星晶圓代工(Samsung Foundry)生產(chǎn),采用其高性能、高能效的 5 納米工藝節(jié)點(diǎn)。二者將共同支持企業(yè)的先進(jìn)AI 用例,釋放業(yè)務(wù)價(jià)值,從而創(chuàng)造新的競(jìng)爭(zhēng)優(yōu)勢(shì)。利用AI集成的方法,客戶(hù)可以更快、更準(zhǔn)確地獲得預(yù)測(cè)結(jié)果。適用的生成式 AI用例包括:

  • 保險(xiǎn)理賠欺詐檢測(cè):通過(guò)AI集成方法將大語(yǔ)言模型與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相結(jié)合,以提高性能和準(zhǔn)確性,增強(qiáng)對(duì)保險(xiǎn)理賠欺詐的檢測(cè)。
  • 反洗錢(qián)高級(jí)監(jiān)測(cè):對(duì)可疑金融活動(dòng)進(jìn)行高級(jí)檢測(cè),支持遵守監(jiān)管要求并降低金融犯罪風(fēng)險(xiǎn)。
  • AI 助手:加速應(yīng)用生命周期、知識(shí)和專(zhuān)業(yè)技能的傳授、代碼解釋和轉(zhuǎn)換等。

規(guī)格和性能指標(biāo)

  • Telum II 處理器:配備八個(gè)運(yùn)行頻率達(dá) 5.5GHz的高性能內(nèi)核,每個(gè)內(nèi)核配備 36MB二級(jí)高速緩存,片上高速緩存容量增加 40%(總?cè)萘窟_(dá) 360MB)。每個(gè)處理器抽屜的虛擬 L4 高速緩存為 2.88GB,相比上一代增加 40%。集成的 AI 加速器可實(shí)現(xiàn)低延遲、高吞吐量的交易中 AI 推理,例如增強(qiáng)金融交易期間的欺詐檢測(cè),并且每塊芯片的計(jì)算能力是上一代的四倍。

    Telum II 芯片中集成了最新的 I/O 加速單元 DPU。在設(shè)計(jì)上,其I/O 密度提高 50%,可大幅提高數(shù)據(jù)處理能力,進(jìn)一步提高 IBM Z 的整體效率和可擴(kuò)展性,使其成為處理大規(guī)模AI工作負(fù)載和數(shù)據(jù)密集型應(yīng)用的不二之選。 

  • Spyre 加速器:這是一款專(zhuān)為復(fù)雜 AI 模型和生成式 AI 用例提供可擴(kuò)展功能的企業(yè)級(jí)加速器。它有高達(dá) 1TB 的內(nèi)存,可在普通 IO 抽屜的八塊卡上串聯(lián)工作,以支持大型主機(jī)的整體 AI 工作負(fù)載,同時(shí)每塊卡的功耗不超過(guò) 75W。每塊芯片由 32 個(gè)計(jì)算內(nèi)核組成,支持 int4、int8、fp8 和 fp16 數(shù)據(jù)類(lèi)型,適用于低延遲和高吞吐量的 AI 應(yīng)用。

產(chǎn)品時(shí)間表
作為 IBM 下一代 IBM Z 和 IBM LinuxONE 平臺(tái)的中央處理器,Telum II 處理器預(yù)計(jì)在 2025 年向 IBM Z 和 LinuxONE 客戶(hù)提供。IBM Spyre 加速器仍在技術(shù)預(yù)覽階段,預(yù)計(jì)也將于 2025 年推出。

關(guān)于 IBM 未來(lái)方向和意向的聲明可能會(huì)隨時(shí)更改或撤銷(xiāo),恕不另行通知。

訪(fǎng)問(wèn)下方鏈接了解更多:

關(guān)于IBM

IBM 是全球領(lǐng)先的混合云、人工智能及企業(yè)服務(wù)提供商,幫助超過(guò) 175 個(gè)國(guó)家和地區(qū)的客戶(hù),從其擁有的數(shù)據(jù)中獲取商業(yè)洞察,簡(jiǎn)化業(yè)務(wù)流程,降低成本,并獲得行業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì)。金融服務(wù)、電信和醫(yī)療健康等關(guān)鍵基礎(chǔ)設(shè)施領(lǐng)域的超過(guò) 4000 家政府和企業(yè)實(shí)體依靠 IBM 混合云平臺(tái)和紅帽 OpenShift 快速、高效、安全地實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型。IBM 在人工智能、量子計(jì)算、行業(yè)云解決方案和企業(yè)服務(wù)方面的突破性創(chuàng)新為我們的客戶(hù)提供了開(kāi)放和靈活的選擇。對(duì)企業(yè)誠(chéng)信、透明治理、社會(huì)責(zé)任、包容文化和服務(wù)精神的長(zhǎng)期承諾是 IBM 業(yè)務(wù)發(fā)展的基石。

 

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀(guān)點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車(chē) 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶(hù)希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱(chēng),數(shù)字世界的話(huà)語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱(chēng)"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉