浪潮源1.0大模型登頂中文語(yǔ)言能力評(píng)測(cè)基準(zhǔn)CUGE榜首
(全球TMT2022年6月9日訊)近日,浪潮"源1.0"大模型登頂中文語(yǔ)言能力理解和生成評(píng)測(cè)基準(zhǔn)CUGE總榜榜首,并獲得語(yǔ)言理解(篇章級(jí))、語(yǔ)言生成、對(duì)話交互、多語(yǔ)言、數(shù)學(xué)推理等5項(xiàng)評(píng)測(cè)最佳成績(jī)。
在語(yǔ)言理解(篇章級(jí))評(píng)測(cè)中,源1.0僅用時(shí)11分鐘,便完成數(shù)千篇閱讀理解回答4000多個(gè)問(wèn)題,以86.9高分的成績(jī)位居榜首,展現(xiàn)出頂尖的語(yǔ)言理解能力。在語(yǔ)言生成評(píng)測(cè)中,源1.0僅用時(shí)70秒,就完成近800條摘要內(nèi)容的生成,登頂該項(xiàng)榜單。源大模型強(qiáng)大的文本生成能力可提升智能問(wèn)答與對(duì)話、新聞?wù)?、?bào)告生成等場(chǎng)景中AI智能化水平。在多語(yǔ)言機(jī)器翻譯評(píng)測(cè)中,基于源1.0大模型蒸餾出來(lái)的翻譯模型在完成近4000千對(duì)中英文互譯后,登頂榜首,領(lǐng)先第二名15%。在對(duì)話交互評(píng)測(cè)中,基于源1.0大模型蒸餾出來(lái)的對(duì)話模型回答了電影、音樂(lè)、旅行3個(gè)領(lǐng)域共近萬(wàn)個(gè)主題對(duì)話,成績(jī)位居榜首,領(lǐng)先第二名成績(jī)30%。在CUGE數(shù)學(xué)推理評(píng)測(cè)中,源1.0大模型完成1000道小學(xué)數(shù)學(xué)應(yīng)用題,以76.9的高分大幅領(lǐng)先高居榜首。