當前位置:首頁 > 芯聞號 > 美通社全球TMT
[導讀] Granite 3.2是小型的 AI 模型,通過對開發(fā)人員友好的授權條款,提供推理、視覺和護欄功能 更新后的 Granite 時間序列模型可提供長期預測,參數少于10M;適用于金融與經濟趨勢分析、供應鏈需求預測,以及零售業(yè)的...

IBM 推出Granite 3.2:全新企業(yè)級多模態(tài)及推理的AI模型

  • Granite 3.2是小型的 AI 模型,通過對開發(fā)人員友好的授權條款,提供推理、視覺和護欄功能
  • 更新后的 Granite 時間序列模型可提供長期預測,參數少于10M;適用于金融與經濟趨勢分析、供應鏈需求預測,以及零售業(yè)的季節(jié)性庫存規(guī)劃等用例

北京, 2025年3月4日 /美通社/ -- IBM于2月底推出其 Granite 大型語言模型家族的最新一代產品 Granite 3.2,持續(xù)推動小型、高效、企業(yè)專用的 AI,為實際應用創(chuàng)造效益。

IBM 推出 Granite 3.2 大語言模型,體現 IBM 發(fā)展企業(yè)專用、小型、高效與實用 AI 的策略。

IBM 推出 Granite 3.2 大語言模型,體現 IBM 發(fā)展企業(yè)專用、小型、高效與實用 AI 的策略。

所有 Granite 3.2 模型均采用寬松的 Apache 2.0 開源授權條款,可在 Hugging Face 下載。部分模型現已在 IBM watsonx.ai、Ollama、Replicate 和 LM Studio 上提供,預計不久將支援 RHEL AI 1.5,為企業(yè)與開源社區(qū)注入更強大的 AI 能力。

主要亮點

  • 全新視覺語言模型:專為理解文件任務而設計,在關鍵企業(yè)基準測試 DocVQA、ChartQA、AI2D 和 OCRBench[1] 中,表現可媲美甚至超越更大規(guī)模的模型(如 Llama 3.2 11B 和 Pixtral 12B)。除了強大的訓練數據外,IBM 也利用其開源 Docling 工具包處理8千5百萬份 PDF 文件,并生成2千6百萬個合成問答配對,提升視覺語言模型在處理大量文件工作流時的能力。
  • 增強推理功能:Granite 3.2的2B與8B模型加入了「思維鏈」(Chain of Thought,CoT)推理機制,且使用者可以開啟或關閉推理功能以優(yōu)化效率。通過這項能力,8B 模型在 ArenaHard 和 Alpaca Eval 等指令遵循基準測試中的表現[2],比前一代優(yōu)異比例達到兩位數,且不影響其他領域的安全性或性能。此外,通過創(chuàng)新的推理擴展方法,Granite 3.2 8B 模型可以調整至接近 Claude 3.5 Sonnet 或 GPT-4o 在數學推理基準(如 AIME2024 和 MATH500[3])上的表現。
  • Granite Guardian 安全模型更輕巧:在保持 Granite 3.1 Guardian 模型性能的同時,模型尺寸減少三成。此外,Granite 3.2 系列還引入了語言化信心評估(Verbalized Confidence)新功能,可提供更精細的風險評估,幫助安全監(jiān)測系統(tǒng)識別不確定性。

IBM 持續(xù)推動企業(yè)專用的小型 AI 模型策略,并已在測試中展現高效能。例如,Granite 3.1 8B 模型在 Salesforce 大型語言模型CRM基準測試中獲得高分,顯示其在實際應用中的準確度和可靠性。

IBM Granite 模型家族擁有廣大的合作伙伴生態(tài)體系,許多領先的軟件公司已將Granite模型嵌入其技術。Granite 3.2 是 IBM 在推動企業(yè)專用小型 AI 方面的重要進展,體現了 IBM 致力于提供小型、高效、實用 AI 的產品策略。

CrushBank 首席技術官 David Tan 表示:"在 CrushBank,我們親眼目睹了 IBM 開放、高效的人工智能模型如何為企業(yè)人工智能帶來真正的價值--在性能、成本效益和可擴展性之間實現適當的平衡。Granite 3.2 通過新的推理功能更進一步,我們很高興能在構建新的代理(智能體)解決方案時探索這些功能。"

Granite 3.2 是 IBM 產品組合和戰(zhàn)略發(fā)展的重要一步,旨在為企業(yè)提供小型實用的 AI。雖然思維鏈在推理任務中表現強大,但它需要大量計算資源,并非所有任務都必須啟用。因此,IBM 在 Granite 3.2 模型中加入了程式化開關功能,使用者可以根據需求開啟或關閉推理模式;模型可在不啟用推理的情況下運行較簡單的任務,以降低不必要的計算成本。

此外,其他推理技術(例如推理擴展 Inference Scaling) 已顯示 Granite 3.2 8B 模型能夠在標準數學推理基準測試中,媲美甚至超越更大模型的性能。持續(xù)發(fā)展這項推理技術也是 IBM 研究團隊的重點方向[4],以進一步提升 AI 的效能與應用范圍。

除了 Granite 3.2 的指令、視覺和防護模型之外,IBM 也推出了新一代 TinyTimeMixers(TTM)時間序列模型,這些模型的參數少于1千萬,具備長期預測能力,可進行長達兩年的長期預測。這些模型為長期趨勢分析提供強大工具,適用于金融與經濟趨勢分析、供應鏈需求預測,以及零售業(yè)的季節(jié)性庫存規(guī)劃。

IBM AI 研究副總裁 Sriram Raghavan 表示:"AI 的下一個時代將聚焦效率、整合與實際應用的影響力 — 企業(yè)應該能夠在不過度消耗計算資源的情境下,取得強大的 AI 效益。IBM 最新的 Granite 模型發(fā)展專注于開放式解決方案,逐步推動 AI 的普及,使其更具成本效益,為現代企業(yè)創(chuàng)造更大價值。"

欲了解Granite 3.2 的技術細節(jié),請參閱相關技術文章。

關于IBM

IBM 是全球領先的混合云、人工智能及企業(yè)服務提供商,幫助超過 175 個國家和地區(qū)的客戶,從其擁有的數據中獲取商業(yè)洞察,簡化業(yè)務流程,降低成本,并獲得行業(yè)競爭優(yōu)勢。金融服務、電信和醫(yī)療健康等關鍵基礎設施領域的超過 4000 家政府和企業(yè)實體依靠 IBM 混合云平臺和 Red Hat OpenShift 快速、高效、安全地實現數字化轉型。IBM 在人工智能、量子計算、行業(yè)云解決方案和企業(yè)服務方面的突破性創(chuàng)新為我們的客戶提供了開放和靈活的選擇。對企業(yè)誠信、透明治理、社會責任、包容文化和服務精神的長期承諾是 IBM 業(yè)務發(fā)展的基石。


[1] 視覺模型(Vision Model) 的基準測試結果可在 IBM技術文章 《IBM Granite 3.2:推理、視覺、預測與更多應用》(2025 年 2 月 26 日發(fā)布)中查閱。 [2] 指令模型(Instruct Model) 的基準測試結果可在 IBM 技術文章 《IBM Granite 3.2:推理、視覺、預測與更多應用》(2025 年 2 月 26 日發(fā)布)中查閱。 [3] 推理擴展(Inference Scaling) 的基準測試結果可在 IBM技術研究部落格 《Granite 3.2 中的推理:利用推理擴展技術》(2025 年 2 月 26 日發(fā)布)中查閱。 [4] 推理擴展技術在 Granite 3.2 中的應用,IBM 技術研究部落格,2025 年 2 月 26 日發(fā)布

 

IBM Corporation logo.

IBM Corporation logo.

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯系該專欄作者,如若文章內容侵犯您的權益,請及時聯系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數據產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數據產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯合牽頭組建的NVI技術創(chuàng)新聯盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現場 NVI技術創(chuàng)新聯...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉