浪潮源1.0大模型登頂中文語言能力評測基準(zhǔn)CUGE榜首
(全球TMT2022年6月9日訊)近日,浪潮"源1.0"大模型登頂中文語言能力理解和生成評測基準(zhǔn)CUGE總榜榜首,并獲得語言理解(篇章級)、語言生成、對話交互、多語言、數(shù)學(xué)推理等5項評測最佳成績。

在語言理解(篇章級)評測中,源1.0僅用時11分鐘,便完成數(shù)千篇閱讀理解回答4000多個問題,以86.9高分的成績位居榜首,展現(xiàn)出頂尖的語言理解能力。在語言生成評測中,源1.0僅用時70秒,就完成近800條摘要內(nèi)容的生成,登頂該項榜單。源大模型強(qiáng)大的文本生成能力可提升智能問答與對話、新聞?wù)?、報告生成等場景中AI智能化水平。在多語言機(jī)器翻譯評測中,基于源1.0大模型蒸餾出來的翻譯模型在完成近4000千對中英文互譯后,登頂榜首,領(lǐng)先第二名15%。在對話交互評測中,基于源1.0大模型蒸餾出來的對話模型回答了電影、音樂、旅行3個領(lǐng)域共近萬個主題對話,成績位居榜首,領(lǐng)先第二名成績30%。在CUGE數(shù)學(xué)推理評測中,源1.0大模型完成1000道小學(xué)數(shù)學(xué)應(yīng)用題,以76.9的高分大幅領(lǐng)先高居榜首。