浪潮信息發(fā)布基于“源1.0”大模型生成的4個(gè)技能大模型
掃描二維碼
隨時(shí)隨地手機(jī)看文章
(全球TMT2022年7月1日訊)近日,浪潮信息發(fā)布了基于"源1.0"大模型生成的4個(gè)技能大模型(Skill Model),分別為對(duì)話模型"源曉問(wèn)"、問(wèn)答模型"源曉搜"、翻譯模型"源曉譯"、古文模型"源曉文"。這些技能大模型在各自細(xì)分領(lǐng)域的精度業(yè)界領(lǐng)先,可直接應(yīng)用于人機(jī)交互、知識(shí)檢索、語(yǔ)言翻譯和文學(xué)創(chuàng)作等領(lǐng)域,模型運(yùn)行速度最高提升9倍。更重要的是,基于大模型快速生成特定領(lǐng)域的技能大模型(Skill Model),也意味著"源"的AI生產(chǎn)力大幅升級(jí),能夠幫助商業(yè)組織和研究機(jī)構(gòu)實(shí)現(xiàn)對(duì)AI技術(shù)的高效、快速和低成本應(yīng)用,加速產(chǎn)業(yè)AI化。
對(duì)話模型("源曉問(wèn)")在源大模型基礎(chǔ)上,又采用了2660萬(wàn)條醫(yī)療、法律、保險(xiǎn)等不同行業(yè),歷史、電影、娛樂(lè)等不同場(chǎng)景的對(duì)話語(yǔ)料數(shù)據(jù)進(jìn)行強(qiáng)化訓(xùn)練,在高頻閑聊、知識(shí)問(wèn)答等開放式問(wèn)答對(duì)話上表現(xiàn)突出。翻譯模型("源曉譯")基于源大模型閱讀的海量高質(zhì)量數(shù)據(jù)集,采用維基百科、書籍、聯(lián)合國(guó)文件及字幕組等近80G高質(zhì)量數(shù)據(jù)集進(jìn)行強(qiáng)化訓(xùn)練,因此翻譯不但流暢準(zhǔn)確,同時(shí)更符合中文表述,在中譯英時(shí)表述更加專業(yè)地道,可輕松應(yīng)對(duì)日常對(duì)話、新聞、哲學(xué)、小說(shuō)等日常的語(yǔ)言翻譯任務(wù)。問(wèn)答模型("源曉搜")鏈接了包含了維基百科、書籍等知識(shí)的數(shù)據(jù)庫(kù),根據(jù)用戶提問(wèn)的內(nèi)容,利用高性能檢索方法,快速地從知識(shí)數(shù)據(jù)庫(kù)中檢索到與提問(wèn)內(nèi)容相關(guān)的內(nèi)容作為背景知識(shí),在相關(guān)專業(yè)知識(shí)背景下回答問(wèn)題,能夠生成符合人類語(yǔ)言習(xí)慣的專業(yè)答復(fù)。古文模型("源曉文")在源大模型精讀了5000GB高質(zhì)量中文的基礎(chǔ)上,又學(xué)習(xí)了先秦到近代幾乎所有詩(shī)詞,并精選其中最優(yōu)秀的10萬(wàn)首進(jìn)行強(qiáng)化訓(xùn)練。海量學(xué)習(xí)兼針對(duì)性強(qiáng)化訓(xùn)練使得古文理解模型能夠精通古詩(shī)詞的用詞、文法及平仄格律等規(guī)則,還擅長(zhǎng)營(yíng)造意境、引經(jīng)據(jù)典,同時(shí)兼具古文解析的能力。