商湯科技日日新SenseNova 4.0發(fā)布:這?次,帶來全新的AI體驗!
商湯科技發(fā)布“日日新SenseNova 4.0”,多維度全面升級大模型體系。
“日日新SenseNova 4.0”擁有更全?的知識覆蓋、更可靠的推理能?,更優(yōu)越的長?本理解力及更穩(wěn)定的數(shù)字推理能?和更強的代碼?成能?,并?持跨模態(tài)交互。日日新·商量大語言模型-通用版本(SenseChat V4),支持128K語境窗口長度,綜合整體評測成績水平比肩 GPT 4,相較GPT 3.5已經(jīng)實現(xiàn)全?超越。
商湯還率先推出了支持不同模態(tài)工具調(diào)用的??新·商量大語言模型Function call & Assistants API 版本,為先進(jìn)的大模型與各類應(yīng)用服務(wù)工具的連接提供便利橋梁,顯著降低開發(fā)者使用大模型的門檻。
商湯也將先進(jìn)的大模型能力轉(zhuǎn)化為落地實際場景的產(chǎn)品應(yīng)用,基于最新發(fā)布的??新·商量大語言模型Function call & Assistants API 完成開發(fā)并發(fā)布數(shù)據(jù)分析工具“辦公小浣熊”。
目前,憑借豐富的AI技術(shù)能力,商湯“日日新Sense Nova”大模型體系以低成本、高效率打通了各類AI應(yīng)用,提供包括:面向辦公場景的商湯??新·商量語??模型-數(shù)據(jù)分析版本、面向醫(yī)療場景的日日新·商量語言大模型-醫(yī)療版本“大醫(yī)”、 面向自動駕駛及工業(yè)場景的日日新·商量多模態(tài)大模型,以及面向創(chuàng)作創(chuàng)意場景的日日新·秒畫文生圖大模型等豐富的工具。
商湯“??新·商量大語言模型”在金融、手機、醫(yī)療、汽車、地產(chǎn)、能源、傳媒、工業(yè)制造等眾多垂直行業(yè),已與超過500家客戶建立深度合作,加速行業(yè)企業(yè)的智能化轉(zhuǎn)型。
接下來,商湯“日日新SenseNova”大模型體系及相關(guān)產(chǎn)品和工具為實現(xiàn)通用人工智能(AGI)提供了精準(zhǔn)著力點,助力全場景、多產(chǎn)業(yè)實現(xiàn)“大模型+”,拓寬大模型應(yīng)用邊界。
“節(jié)前大上新”!超豐富大模型體系,AI能力隨取隨用
“日日新SenseNova 4.0”提供了多種靈活的API接口和服務(wù),開發(fā)人員可以根據(jù)實際應(yīng)用需求,輕松地調(diào)用日日新SenseNova大模型的各項AI技術(shù)能力,以更低成本、更高效率實現(xiàn)各類AI應(yīng)用。
大模型性能提升的基礎(chǔ),在于語言建模能力的增強?!叭杖招耂enseNova4.0”全新升級日日新·商量大語言模型-通用版本(SenseChat V4),目前支持4k、32k、128k tokens不同窗口,拓展了模型應(yīng)用范圍。SenseChat V4 顯著提升了在知識理解、閱讀理解、綜合推理、數(shù)理、代碼和長文本理解等領(lǐng)域的通用能力,綜合整體評測成績水平比肩GPT-4 ,其中推理和代碼編程的測評表現(xiàn)更是超越了GPT-4。在權(quán)威測試集HumanEval Coding的測試中,一次通過率達(dá)到75.6%(GPT-4此項數(shù)據(jù)為74.4%)。
基于大模型評測平臺OpenCompass全集測試,日日新·商量大語言模型SenseChat V4,綜合整體評測成績水平比肩GPT-4
商湯??新·商量語??模型-數(shù)據(jù)分析版本(SenseChat-DataAnalysis V4)發(fā)布,在數(shù)據(jù)分析場景下的數(shù)據(jù)測試集(1000+題目)中以85.71%的正確率超過GPT-4,支持復(fù)雜表格、多表格、多文件的理解,實現(xiàn)數(shù)據(jù)清洗、數(shù)據(jù)運算、比較分析、趨勢分析,預(yù)測性分析、可視化等常見數(shù)據(jù)分析任務(wù),賦能財務(wù)分析、商業(yè)分析、銷售預(yù)測、市場分析、宏觀分析等多個應(yīng)用場景。
商湯推出的日日新·商量語言大模型-醫(yī)療版本“大醫(yī)”(SenseChat-Medical V4),在本次更新中實現(xiàn)了更強的多輪對話與上下文理解能力、以及更豐富的工具調(diào)用能力,有效實現(xiàn)專業(yè)醫(yī)學(xué)問答及復(fù)雜醫(yī)學(xué)任務(wù)推理,并支持更多模態(tài)醫(yī)學(xué)文件的智能解讀和交互問答?!按筢t(yī)”在兩項行業(yè)權(quán)威評測——2023年職業(yè)藥劑師考試大模型評測、中文醫(yī)療大語言模型開放評測平臺MedBench中,均實現(xiàn)綜合評分排名第二,性能逼近GPT-4,其中職業(yè)藥劑師考試大模型評測中的兩個細(xì)分方向性能已超越GPT-4。
2023年職業(yè)藥劑師考試大模型評測結(jié)果,“大醫(yī)”綜合評分排名第二,并在兩個細(xì)分方向上性能超越GPT-4
覆蓋13個醫(yī)學(xué)場景的大醫(yī)Web端展示頁面
多模態(tài)是人工智能大模型重要的技術(shù)演進(jìn)方向,日日新·商量多模態(tài)大模型(SenseChat-Vision V4)全新推出,其擁有300億參數(shù),圖文理解能力處于全球領(lǐng)先水平,在權(quán)威評測基準(zhǔn)測試集MME Benchmark上綜合得分排名首位,綜合得分達(dá)2199.5(超過GPT-4V的1926.57),已在智能駕駛、智能車艙、電力行業(yè)等多個實際場景落地應(yīng)用,助力千行百業(yè)的產(chǎn)業(yè)升級。
多模態(tài)大模型權(quán)威綜合基準(zhǔn)測試MME Benchmark可以從定位、名人識別、景點識別、OCR、數(shù)學(xué)計算等14個維度來系統(tǒng)綜合評測模型的能力。
日日新·商量多模態(tài)大模型可回答交通場景中圖文內(nèi)容理解等復(fù)雜任務(wù)
商湯自研的日日新·秒畫文生圖大模型(SenseMirage V4)較此前版本,參數(shù)量提升至百億量級,通過Mixture of text experts、Spatial-aware CFG等算法優(yōu)化,語義理解能力與圖像質(zhì)感細(xì)節(jié)表現(xiàn)顯著增強,可達(dá)成電影級海報生成水平。同時結(jié)合Adversarial Distillation算法,秒畫SenseMirage-Turbo V4版本也對外發(fā)布,相較于V4基礎(chǔ)版本,可達(dá)到10倍推理加速效果。
秒畫SenseMirage V4全新升級,電影級圖片一鍵生成
率先支持不同模態(tài)工具調(diào)用的Function call & Assistants API 版本來了,大模型時代的專屬開發(fā)助手
大模型的能力前沿且豐富,為助力更多開發(fā)人員及相關(guān)行業(yè)更便捷、高效地用好大模型,商湯推出??新·商量大語言模型Function call & Assistants API 版本。
??新·商量大語言模型Function call & Assistants API 版本為開發(fā)人員提供一個靈活、高度可定制的工具調(diào)用框架,提供了聯(lián)網(wǎng)搜索,代碼解釋,圖文問答,??圖等多種?具調(diào)?,?持商湯??新?模型體系,賦能多?業(yè)場景。
與其他同類產(chǎn)品相比,??新·商量大語言模型Function call & Assistants API 版本率先支持不同模態(tài)的工具調(diào)用,能夠支持圖文結(jié)合的多模態(tài)交互和數(shù)據(jù)分析代碼執(zhí)行結(jié)果的直觀呈現(xiàn),從而解決更加復(fù)雜的問題,讓各種應(yīng)?程序中集成AI功能變得更加簡單和?效。
通過??新·商量大語言模型Function call & Assistants API,輕松調(diào)用內(nèi)置工具實現(xiàn)多模態(tài)交互(注:展示效果有加速處理)
創(chuàng)新場景應(yīng)用加速落地,商湯“日日新”大模型體系持續(xù)賦能多產(chǎn)業(yè)升級
大模型的出現(xiàn)帶來了人機交互范式的巨大轉(zhuǎn)換,依托商湯“日日新Sensenova”能力的快速迭代,小浣熊家族再添新成員——數(shù)據(jù)分析工具 “辦公小浣熊”,重塑大模型時代的應(yīng)用產(chǎn)品形態(tài)。
辦公小浣熊是一款無需編程或復(fù)雜操作即可使用的數(shù)據(jù)分析工具。通過自然語言輸入,辦公小浣熊結(jié)合商湯大模型體系的意圖識別、邏輯理解、代碼生成能力,自動將數(shù)據(jù)轉(zhuǎn)化為有意義的分析結(jié)果和可視化圖表。得益于商湯大模型體系的強大中文理解能力,該產(chǎn)品更適應(yīng)中國的數(shù)據(jù)分析需求。
辦公小浣熊演示頁面:輸入表格,輕松get 分析報告。
產(chǎn)品形態(tài)的出現(xiàn)是大模型技術(shù)落地應(yīng)用的嘗試之一,自2023年4月10日商湯“日日新SenseNova”問世以來,企業(yè)用戶超過3000家,覆蓋行業(yè)包括互聯(lián)網(wǎng)、游戲、文旅、教育、醫(yī)療健康、金融和編程等。
商湯始終推動降低大模型使用門檻,拓展人工智能落地場景,讓大模型真正在行業(yè)里用起來,未來將持續(xù)推進(jìn)“日日新SenseNova”大模型體系建設(shè),實現(xiàn)創(chuàng)新場景應(yīng)用,不斷推動大模型前置化,讓更多智能走向更多場景、更多行業(yè),攜手行業(yè)生態(tài)邁向AGI時代。