浪潮發(fā)布“源1.0”開源開放計(jì)劃，全球最大中文巨量模型將普惠AI產(chǎn)業(yè)

時(shí)間：2021-11-01 14:36:38

關(guān)鍵字：開源模型 AI

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]北京2021年10月29日 /美通社/ -- 10月26日，在北京舉行的2021人工智能計(jì)算大會(huì)(AICC 2021)上，浪潮人工智能研究院正式發(fā)布“源1.0”開源開放計(jì)劃，這一全球最大中文巨量模型將以開放API、開放數(shù)據(jù)集、開源代碼等多種形式為業(yè)界提供開放合作，人工智能相關(guān)高校...

北京2021年10月29日 /美通社/ -- 10月26日，在北京舉行的2021人工智能計(jì)算大會(huì)(AICC 2021)上，浪潮人工智能研究院正式發(fā)布“源1.0”開源開放計(jì)劃，這一全球最大中文巨量模型將以開放API、開放數(shù)據(jù)集、開源代碼等多種形式為業(yè)界提供開放合作，人工智能相關(guān)高校和科研機(jī)構(gòu)、產(chǎn)業(yè)伙伴及智能計(jì)算中心用戶可通過“源1.0”官網(wǎng)air.inspur.com提出申請(qǐng)，經(jīng)審核授權(quán)后即可基于“源1.0”模型探索算法創(chuàng)新以及開發(fā)各類智能化應(yīng)用。

浪潮發(fā)布“源1.0”開源開放計(jì)劃，全球最大中文巨量模型將普惠AI產(chǎn)業(yè)

浪潮宣布全球最大中文AI巨量模型＂源1.0”開源開放計(jì)劃

“源1.0” 開源開放計(jì)劃將首先面向三類群體，一是高?；蚩蒲袡C(jī)構(gòu)的人工智能研究團(tuán)隊(duì)，二是元腦生態(tài)合作伙伴，三是智能計(jì)算中心。面向第一類群體，“源1.0”將主要支撐在語言智能前沿領(lǐng)域的算法創(chuàng)新和方向探索；面向第二類群體，“源1.0”將主要支撐元腦生態(tài)伙伴開發(fā)行業(yè)示范性應(yīng)用，如智能文本服務(wù)、語言翻譯服務(wù)、內(nèi)容生產(chǎn)服務(wù)等等，探索語言智能產(chǎn)業(yè)落地的“殺手級(jí)應(yīng)用”；面向第三類群體，“源1.0”將作為算法基礎(chǔ)設(shè)施，與智能計(jì)算中心算力基礎(chǔ)設(shè)施高效協(xié)同，支撐AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化發(fā)展。

“源1.0”開放開源計(jì)劃項(xiàng)目包含開放模型API，開放高質(zhì)量中文數(shù)據(jù)集，開源模型訓(xùn)練代碼、推理代碼和應(yīng)用代碼等。同時(shí)，浪潮人工智能研究院將和合作伙伴一起，共同開展針對(duì)國產(chǎn)AI芯片的“源1.0”模型移植開發(fā)工作。

為更好的支撐“源1.0”的開源開放計(jì)劃，浪潮人工智能研究院將加強(qiáng)模型API和平臺(tái)生態(tài)構(gòu)建，開發(fā)支持高并發(fā)、高速推理的多種API接口，以支持各類用戶對(duì)模型或功能的不同請(qǐng)求方式。同時(shí)，浪潮人工智能研究院也將大力運(yùn)營“源1.0”開源開放社區(qū)，建立完善的開發(fā)反饋機(jī)制并加快模型迭代。

浪潮信息副總裁、AI&HPC產(chǎn)品線總經(jīng)理劉軍表示：“巨量模型應(yīng)該成為普惠性的科技進(jìn)步力量，讓行業(yè)用戶甚至是中小用戶也能使用巨量模型尋求深度創(chuàng)新，促進(jìn)業(yè)務(wù)可持續(xù)健康發(fā)展，這是浪潮開源開放‘源1.0’的初衷。我們希望與更多的產(chǎn)、學(xué)、研、用單位和開發(fā)者一起，從技術(shù)創(chuàng)新、場(chǎng)景融合、應(yīng)用開發(fā)等各個(gè)維度，共同促進(jìn)巨量模型的健康發(fā)展與產(chǎn)業(yè)落地?！?/p>

“源1.0”是全球最大規(guī)模的中文AI巨量模型，其參數(shù)規(guī)模高達(dá)2457億，訓(xùn)練采用的中文數(shù)據(jù)集達(dá)5000GB，相比GPT-3模型1750億參數(shù)量和570GB訓(xùn)練數(shù)據(jù)集，“源1.0”參數(shù)規(guī)模領(lǐng)先40%，訓(xùn)練數(shù)據(jù)集規(guī)模領(lǐng)先近10倍。 “源1.0”在語言智能方面表現(xiàn)優(yōu)異，獲得中文語言理解評(píng)測(cè)基準(zhǔn)CLUE榜單的零樣本學(xué)習(xí)和小樣本學(xué)習(xí)兩類總榜冠軍，測(cè)試結(jié)果顯示，人群能夠準(zhǔn)確分辨人與“源1.0”作品差別的成功率已低于50%。

在AICC 2021大會(huì)現(xiàn)場(chǎng)，參會(huì)人員與“源1.0”進(jìn)行實(shí)時(shí)互動(dòng)，根據(jù)互動(dòng)者給出的主題或者上聯(lián)，“源1.0”會(huì)迅速作出詩歌或者對(duì)出下聯(lián)。眾多參會(huì)者在現(xiàn)場(chǎng)體驗(yàn)“源1.0”的詩詞創(chuàng)作能力，體驗(yàn)者表示，如果不是親身體驗(yàn)，肯定看不出來詩歌是AI模型創(chuàng)作的，“重要的不僅能押好韻，而且更能寫出中文詩的美妙意境?！?/p>

浪潮發(fā)布“源1.0”開源開放計(jì)劃，全球最大中文巨量模型將普惠AI產(chǎn)業(yè)

AICC參會(huì)者排隊(duì)體驗(yàn)“源1.0”巨量模型的文學(xué)創(chuàng)作能力

浪潮人工智能研究院透露已啟動(dòng)新的巨量模型“源2.0”的開發(fā)工作，“源2.0”的開發(fā)會(huì)更注重協(xié)同創(chuàng)新，將與業(yè)內(nèi)合作伙伴聯(lián)合展開前沿探索。