近日,海光信息技術團隊成功完成DeepSeek-Janus-Pro多模態(tài)大模型與海光DCU的適配優(yōu)化,并正式上線。這是海光團隊近期完成適配優(yōu)化的第三款DeepSeek大模型,充分展現(xiàn)了DCU強大的生態(tài)優(yōu)勢與技術能力。因DCU采用了GPGPU通用加速計算架構,DeepSeek模型可直接在DCU上運行,并不需要大量適配工作,技術團隊的主要工作是進行精度驗證和持續(xù)的性能優(yōu)化。
用戶現(xiàn)可通過“光合開發(fā)者社區(qū)”中的“光源”板塊訪問并下載相關模型,或直接登錄[www.sourcefind.cn]搜索“deepseek”,即可基于DCU平臺快速部署和使用相關模型,包括高性能的問答基礎模型DeepSeek-V3、推理模型DeepSeek-R1和文生圖模型DeepSeek-Janus-Pro。
本次適配優(yōu)化的DeepSeek-Janus-Pro模型具備跨模態(tài)理解與生成能力,專注于結合視覺與語言理解能力,旨在處理更復雜的跨模態(tài)任務。
(Janus-Pro生成示例)
海光技術團隊負責人表示,海光DCU在短時間內(nèi)快速完成多款大模型適配,充分顯示了DCU基于GPGPU架構實現(xiàn)的兼容主流Al生態(tài)的重要優(yōu)勢,同時驗證了國產(chǎn)算力底座支撐前沿AI模型的技術能力,為金融、制造等行業(yè)的智能化轉型提供了自主可控的技術選項。隨著多模態(tài)AI應用場景的持續(xù)拓展,國產(chǎn)算力基礎設施正成為驅動產(chǎn)業(yè)智能化升級的核心引擎。