原創(chuàng)

美媒：一些中國(guó)大模型已經(jīng)追平甚至超越美國(guó)產(chǎn)品

時(shí)間：2024-12-18 12:46:51

關(guān)鍵字：大模型 AI AI芯片 AI模型

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]CNBC報(bào)道稱，中國(guó)想在AI領(lǐng)域成為統(tǒng)治者，這種嘗試可能已經(jīng)獲得回報(bào)。一些美國(guó)AI業(yè)內(nèi)人士和科技分析人士認(rèn)為，中國(guó)AI模型已經(jīng)相當(dāng)流行，從性能角度看，中國(guó)的一些模型與美國(guó)產(chǎn)品齊頭并進(jìn)，甚至超越。

CNBC報(bào)道稱，中國(guó)想在AI領(lǐng)域成為統(tǒng)治者，這種嘗試可能已經(jīng)獲得回報(bào)。一些美國(guó)AI業(yè)內(nèi)人士和科技分析人士認(rèn)為，中國(guó)AI模型已經(jīng)相當(dāng)流行，從性能角度看，中國(guó)的一些模型與美國(guó)產(chǎn)品齊頭并進(jìn)，甚至超越。

由于無法采購美國(guó)先進(jìn)AI芯片，中國(guó)只能尋找其它辦法增強(qiáng)AI模型性能，比如依賴開源技術(shù)，開發(fā)自主軟件和芯片。

OpenAI ChatGPT是基于閉源模型開發(fā)的，但中國(guó)的許多企業(yè)選擇了開源LLM。查看Hugging Face平臺(tái)，下載最多的LLM有許多來自中國(guó)企業(yè)，其中阿里巴巴Qwen（通義千問）熱度最高，深度求索的DeepSeek也備受推崇。

阿里Qwen、DeepSeek等中國(guó)大模型受追捧

Hugging Face機(jī)器學(xué)習(xí)工程師Tiezhen Wang告訴CNBC：“從評(píng)測(cè)基準(zhǔn)看，Qwen的性能極為出色，這是它快速流行的主要原因。”還有，Qwen的授權(quán)模式比較友好，企業(yè)使用時(shí)法律評(píng)估沒有那么復(fù)雜。

阿里巴巴給Qwen分了級(jí)，有的參數(shù)很多，更強(qiáng)大，但算力要求高，運(yùn)行成本也高，如果是參數(shù)少的小模型，運(yùn)行成本更低。

Tiezhen Wang說：“不管你選擇什么規(guī)模的模型，Qwen都可能是現(xiàn)今性能最棒的模型之一?！?

DeepSeek也成為耀眼明星，它不久前剛剛推出DeepSeek-R1模型。上個(gè)月DeepSeek發(fā)布消息稱，R1模型可以與OpenAI o1模型競(jìng)爭(zhēng)。

中國(guó)企業(yè)宣稱，它們的模型可以與Meta Llama開源模型競(jìng)爭(zhēng)，也與OpenAI等閉源模型一樣好。

Lux Capital合伙人Grace Isford說：“2023年，我觀察到中國(guó)對(duì)開源AI的貢獻(xiàn)不斷增加，中國(guó)模型的性能很強(qiáng)，成本低，吞吐量高?！?

不只是中國(guó)企業(yè)支持開源LLM，Meta和歐洲創(chuàng)業(yè)公司Mistral也有開源版AI模型。隨著中美科技競(jìng)爭(zhēng)加劇，開源模型還有一個(gè)優(yōu)勢(shì)：中國(guó)企業(yè)可以將自己的模型推向全球。

全球咨詢公司DGA Group的合伙人Paul Triolo說：“中國(guó)企業(yè)當(dāng)然希望自己的模型能在中國(guó)之外使用，所以中國(guó)企業(yè)看重開源模型，希望借開源成為AI領(lǐng)域的全球性玩家?！?

中國(guó)企業(yè)認(rèn)為L(zhǎng)LM會(huì)是未來科技生態(tài)系統(tǒng)的核心

雖然全球都在熱炒AI模型，但是到底應(yīng)該在模型之上開發(fā)什么應(yīng)用？未來誰會(huì)主導(dǎo)全球互聯(lián)網(wǎng)版圖？現(xiàn)在還充滿爭(zhēng)論。

Grace Isford說：“如果你認(rèn)為前沿基本AI模型是必需，那就應(yīng)該思考這些模型的用途，比如用于前沿科學(xué)、工程技術(shù)。”

樂觀者將AI模型比作操作系統(tǒng)，它和Windows、Android、iOS一樣重要，有可能會(huì)主導(dǎo)市場(chǎng)，就像科技企業(yè)主導(dǎo)手機(jī)和PC一樣。

英國(guó)倫敦大學(xué)國(guó)王學(xué)院學(xué)者Xin Sun認(rèn)為：“中國(guó)企業(yè)認(rèn)為L(zhǎng)LM會(huì)是未來科技生態(tài)系統(tǒng)的核心。”

Xin Sun還說：“未來的商業(yè)模型有賴于開發(fā)者加入生態(tài)系統(tǒng)，要基于LLM開發(fā)新的應(yīng)用，要通過各種手段吸引用戶、數(shù)據(jù)并獲得利潤(rùn)，遠(yuǎn)不只是引導(dǎo)用戶使用云服務(wù)那么簡(jiǎn)單?！?

中國(guó)構(gòu)建獨(dú)立于英偉達(dá)高性能AI芯片之外的基礎(chǔ)設(shè)施

訓(xùn)練AI模型需要海量數(shù)據(jù)，運(yùn)行時(shí)需要強(qiáng)大算力。英偉達(dá)已經(jīng)成為AI芯片的壟斷者，許多頭部AI企業(yè)也用英偉達(dá)芯片訓(xùn)練模型，但中國(guó)是個(gè)例外。

雖然美國(guó)百般阻撓，禁止英偉達(dá)高端AI芯片流入中國(guó)，但中國(guó)企業(yè)仍然不斷推出先進(jìn)AI模型。

Paul Triolo說：“目前大多中國(guó)科技平臺(tái)都擁有充足的算力，完全可以繼續(xù)優(yōu)化模型。首先，中國(guó)企業(yè)囤積了大量英偉達(dá)GPU；其次，中國(guó)有自己的GPU，它們來自華為等企業(yè)。”

實(shí)際上，中國(guó)科技企業(yè)正在開發(fā)英偉達(dá)芯片的替代品，華為是領(lǐng)導(dǎo)者，百度、阿里巴巴也在投資半導(dǎo)體設(shè)計(jì)。

Paul Triolo認(rèn)為：“在未來的日子里，中國(guó)與美國(guó)先進(jìn)硬件的差距還會(huì)拉大，特別是明年，因?yàn)槊髂暧ミ_(dá)將會(huì)推出Blackwell系統(tǒng)，美國(guó)會(huì)嚴(yán)格禁止Blackwell流向中國(guó)?！?

Grace Isford認(rèn)為，中國(guó)一直在向本國(guó)AI基礎(chǔ)設(shè)施進(jìn)行投資，它獨(dú)立于英偉達(dá)高性能AI芯片之外?！安还苊绹?guó)有沒有禁止英偉達(dá)AI芯片在中國(guó)銷售，中國(guó)都會(huì)繼續(xù)投資，繼續(xù)打造自己的基礎(chǔ)設(shè)施，繼續(xù)開發(fā)、訓(xùn)練AI模型。”（小刀）