美媒:一些中國(guó)大模型已經(jīng)追平甚至超越美國(guó)產(chǎn)品
CNBC報(bào)道稱,中國(guó)想在AI領(lǐng)域成為統(tǒng)治者,這種嘗試可能已經(jīng)獲得回報(bào)。一些美國(guó)AI業(yè)內(nèi)人士和科技分析人士認(rèn)為,中國(guó)AI模型已經(jīng)相當(dāng)流行,從性能角度看,中國(guó)的一些模型與美國(guó)產(chǎn)品齊頭并進(jìn),甚至超越。
由于無法采購美國(guó)先進(jìn)AI芯片,中國(guó)只能尋找其它辦法增強(qiáng)AI模型性能,比如依賴開源技術(shù),開發(fā)自主軟件和芯片。
OpenAI ChatGPT是基于閉源模型開發(fā)的,但中國(guó)的許多企業(yè)選擇了開源LLM。查看Hugging Face平臺(tái),下載最多的LLM有許多來自中國(guó)企業(yè),其中阿里巴巴Qwen(通義千問)熱度最高,深度求索的DeepSeek也備受推崇。
阿里Qwen、DeepSeek等中國(guó)大模型受追捧
Hugging Face機(jī)器學(xué)習(xí)工程師Tiezhen Wang告訴CNBC:“從評(píng)測(cè)基準(zhǔn)看,Qwen的性能極為出色,這是它快速流行的主要原因。”還有,Qwen的授權(quán)模式比較友好,企業(yè)使用時(shí)法律評(píng)估沒有那么復(fù)雜。
阿里巴巴給Qwen分了級(jí),有的參數(shù)很多,更強(qiáng)大,但算力要求高,運(yùn)行成本也高,如果是參數(shù)少的小模型,運(yùn)行成本更低。
Tiezhen Wang說:“不管你選擇什么規(guī)模的模型,Qwen都可能是現(xiàn)今性能最棒的模型之一?!?
DeepSeek也成為耀眼明星,它不久前剛剛推出DeepSeek-R1模型。上個(gè)月DeepSeek發(fā)布消息稱,R1模型可以與OpenAI o1模型競(jìng)爭(zhēng)。
中國(guó)企業(yè)宣稱,它們的模型可以與Meta Llama開源模型競(jìng)爭(zhēng),也與OpenAI等閉源模型一樣好。
Lux Capital合伙人Grace Isford說:“2023年,我觀察到中國(guó)對(duì)開源AI的貢獻(xiàn)不斷增加,中國(guó)模型的性能很強(qiáng),成本低,吞吐量高?!?
不只是中國(guó)企業(yè)支持開源LLM,Meta和歐洲創(chuàng)業(yè)公司Mistral也有開源版AI模型。隨著中美科技競(jìng)爭(zhēng)加劇,開源模型還有一個(gè)優(yōu)勢(shì):中國(guó)企業(yè)可以將自己的模型推向全球。
全球咨詢公司DGA Group的合伙人Paul Triolo說:“中國(guó)企業(yè)當(dāng)然希望自己的模型能在中國(guó)之外使用,所以中國(guó)企業(yè)看重開源模型,希望借開源成為AI領(lǐng)域的全球性玩家?!?
中國(guó)企業(yè)認(rèn)為L(zhǎng)LM會(huì)是未來科技生態(tài)系統(tǒng)的核心
雖然全球都在熱炒AI模型,但是到底應(yīng)該在模型之上開發(fā)什么應(yīng)用?未來誰會(huì)主導(dǎo)全球互聯(lián)網(wǎng)版圖?現(xiàn)在還充滿爭(zhēng)論。
Grace Isford說:“如果你認(rèn)為前沿基本AI模型是必需,那就應(yīng)該思考這些模型的用途,比如用于前沿科學(xué)、工程技術(shù)。”
樂觀者將AI模型比作操作系統(tǒng),它和Windows、Android、iOS一樣重要,有可能會(huì)主導(dǎo)市場(chǎng),就像科技企業(yè)主導(dǎo)手機(jī)和PC一樣。
英國(guó)倫敦大學(xué)國(guó)王學(xué)院學(xué)者Xin Sun認(rèn)為:“中國(guó)企業(yè)認(rèn)為L(zhǎng)LM會(huì)是未來科技生態(tài)系統(tǒng)的核心。”
Xin Sun還說:“未來的商業(yè)模型有賴于開發(fā)者加入生態(tài)系統(tǒng),要基于LLM開發(fā)新的應(yīng)用,要通過各種手段吸引用戶、數(shù)據(jù)并獲得利潤(rùn),遠(yuǎn)不只是引導(dǎo)用戶使用云服務(wù)那么簡(jiǎn)單?!?
中國(guó)構(gòu)建獨(dú)立于英偉達(dá)高性能AI芯片之外的基礎(chǔ)設(shè)施
訓(xùn)練AI模型需要海量數(shù)據(jù),運(yùn)行時(shí)需要強(qiáng)大算力。英偉達(dá)已經(jīng)成為AI芯片的壟斷者,許多頭部AI企業(yè)也用英偉達(dá)芯片訓(xùn)練模型,但中國(guó)是個(gè)例外。
雖然美國(guó)百般阻撓,禁止英偉達(dá)高端AI芯片流入中國(guó),但中國(guó)企業(yè)仍然不斷推出先進(jìn)AI模型。
Paul Triolo說:“目前大多中國(guó)科技平臺(tái)都擁有充足的算力,完全可以繼續(xù)優(yōu)化模型。首先,中國(guó)企業(yè)囤積了大量英偉達(dá)GPU;其次,中國(guó)有自己的GPU,它們來自華為等企業(yè)。”
實(shí)際上,中國(guó)科技企業(yè)正在開發(fā)英偉達(dá)芯片的替代品,華為是領(lǐng)導(dǎo)者,百度、阿里巴巴也在投資半導(dǎo)體設(shè)計(jì)。
Paul Triolo認(rèn)為:“在未來的日子里,中國(guó)與美國(guó)先進(jìn)硬件的差距還會(huì)拉大,特別是明年,因?yàn)槊髂暧ミ_(dá)將會(huì)推出Blackwell系統(tǒng),美國(guó)會(huì)嚴(yán)格禁止Blackwell流向中國(guó)?!?
Grace Isford認(rèn)為,中國(guó)一直在向本國(guó)AI基礎(chǔ)設(shè)施進(jìn)行投資,它獨(dú)立于英偉達(dá)高性能AI芯片之外?!安还苊绹?guó)有沒有禁止英偉達(dá)AI芯片在中國(guó)銷售,中國(guó)都會(huì)繼續(xù)投資,繼續(xù)打造自己的基礎(chǔ)設(shè)施,繼續(xù)開發(fā)、訓(xùn)練AI模型。”(小刀)