原創(chuàng)

簡(jiǎn)述人工智能未來(lái)的發(fā)展趨勢(shì)

時(shí)間：2024-01-25 09:20:01

關(guān)鍵字：人工智能大模型代碼

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]2023年10月18日，中國(guó)在第三屆“一帶一路”國(guó)際合作高峰論壇期間發(fā)布《全球人工智能治理倡議》，圍繞人工智能發(fā)展、安全、治理三方面系統(tǒng)闡述了人工智能治理中國(guó)方案。

2023年10月18日，中國(guó)在第三屆“一帶一路”國(guó)際合作高峰論壇期間發(fā)布《全球人工智能治理倡議》，圍繞人工智能發(fā)展、安全、治理三方面系統(tǒng)闡述了人工智能治理中國(guó)方案。

近年來(lái)，全球人工智能技術(shù)快速發(fā)展，成為推動(dòng)科技和產(chǎn)業(yè)加速發(fā)展的重要力量，對(duì)經(jīng)濟(jì)社會(huì)發(fā)展和人類文明進(jìn)步產(chǎn)生深遠(yuǎn)影響。人工智能技術(shù)發(fā)展現(xiàn)狀如何?有哪些應(yīng)用?未來(lái)趨勢(shì)怎樣?記者采訪了相關(guān)專家。

人工智能處理復(fù)雜任務(wù)的能力大為提升

當(dāng)前，人工智能技術(shù)已進(jìn)入實(shí)用階段，正深刻地改變著人類的生產(chǎn)生活。

“近70年的發(fā)展歷程中，人工智能經(jīng)歷了灌輸規(guī)則、灌輸知識(shí)、從數(shù)據(jù)中學(xué)習(xí)這三個(gè)階段。近年來(lái)在全球迅速發(fā)展的人工智能大模型技術(shù)，其依托的基本模型都基于‘大數(shù)據(jù)+大算力+強(qiáng)算法’訓(xùn)練，這是人工智能發(fā)展第三階段的典型體現(xiàn)。”北京智源人工智能研究院院長(zhǎng)黃鐵軍說(shuō)。

目前，各類人工智能大模型處于迅猛發(fā)展之中，全球眾多高科技企業(yè)紛紛投身人工智能大模型建設(shè)。

“現(xiàn)在圍繞人工智能大模型已形成相對(duì)成熟的技術(shù)框架，但產(chǎn)品和生態(tài)尚在發(fā)展形成之中。”中國(guó)科學(xué)院自動(dòng)化研究所副所長(zhǎng)、研究員曾大軍說(shuō)，“總體而言，人工智能大模型的技術(shù)發(fā)展歷程相比以往任何人工智能技術(shù)都更為迅猛，其影響力也是史無(wú)前例的?！?

人工智能大模型的出現(xiàn)，為通用人工智能的實(shí)現(xiàn)打開(kāi)了新的想象空間，大大提升了人工智能處理復(fù)雜任務(wù)的能力。

“比如，基于人工智能大語(yǔ)言模型的聊天機(jī)器人能夠?qū)崿F(xiàn)高質(zhì)量的信息整合、翻譯和簡(jiǎn)單問(wèn)題求解與規(guī)劃?！痹筌娬f(shuō)，“這類機(jī)器人受到關(guān)注，主要是因?yàn)槠湟殉醪骄邆渫ㄓ萌斯ぶ悄艿牟糠痔匦?，包括通順的自然語(yǔ)言生成、全領(lǐng)域的知識(shí)體系覆蓋、跨任務(wù)場(chǎng)景的通用處理模型、通暢的人機(jī)交互接口。”

不過(guò)，目前人工智能大模型能力仍有局限性。

“一方面，由于人工智能大模型自身結(jié)構(gòu)和機(jī)制漏洞，有被惡意攻擊的風(fēng)險(xiǎn);另一方面，人工智能大模型自身的知識(shí)表達(dá)和學(xué)習(xí)模式還存在缺陷，導(dǎo)致其回答會(huì)有常識(shí)性錯(cuò)誤、杜撰內(nèi)容等?！痹筌娬f(shuō)，“人工智能學(xué)者們正在圍繞這些問(wèn)題進(jìn)行攻關(guān)。”

人工智能加速邁向全面應(yīng)用新階段

“我是剛?cè)雽W(xué)的大一計(jì)算機(jī)專業(yè)學(xué)生，想選修人工智能課程，需要做什么準(zhǔn)備?”“你需要學(xué)習(xí)基礎(chǔ)數(shù)學(xué)知識(shí)、編程語(yǔ)言，學(xué)習(xí)機(jī)器學(xué)習(xí)算法，關(guān)注技術(shù)趨勢(shì)……”這段對(duì)話并非出自師生之間，而是學(xué)生與人工智能之間的問(wèn)答。

2023年8月，浙江大學(xué)聯(lián)合高等教育出版社等發(fā)布“智?！龢?lè)”教育垂直大模型，在核心教材、領(lǐng)域論文和學(xué)位論文等語(yǔ)料和專業(yè)指令數(shù)據(jù)集的基礎(chǔ)上，可提供智能問(wèn)答、試題生成、學(xué)習(xí)導(dǎo)航、教學(xué)評(píng)估等服務(wù)，現(xiàn)已在多所高校應(yīng)用。

“我們把這些教材拆成語(yǔ)句、段落、篇章去‘喂給’大模型，這些高質(zhì)量的語(yǔ)料會(huì)合成詞與詞之間的概率關(guān)聯(lián)，給學(xué)生以啟迪?！闭憬髮W(xué)教授吳飛說(shuō)。

工業(yè)質(zhì)檢、知識(shí)管理、代碼生成、語(yǔ)音交互……當(dāng)前，中國(guó)人工智能正從單點(diǎn)應(yīng)用向多元化應(yīng)用、從通用場(chǎng)景向行業(yè)特定場(chǎng)景不斷深入，加速邁向全面應(yīng)用新階段。特別是隨著人工智能大模型的突破和生成式人工智能的興起，人工智能得以更好處理生產(chǎn)生活中的復(fù)雜問(wèn)題，為各行業(yè)實(shí)現(xiàn)產(chǎn)品和流程革新提供了更加先進(jìn)的工具和手段。

預(yù)測(cè)一個(gè)臺(tái)風(fēng)未來(lái)10天的路徑，過(guò)去需要在3000臺(tái)服務(wù)器上花費(fèi)5小時(shí)進(jìn)行仿真，現(xiàn)在基于預(yù)訓(xùn)練的盤古氣象大模型，10秒內(nèi)就可以獲得更精確的預(yù)測(cè)結(jié)果;字?jǐn)?shù)將近4000萬(wàn)的一套古籍，研究人員利用人工智能，3個(gè)多月就完成了識(shí)別、點(diǎn)校、上線發(fā)布……

“人工智能大模型帶動(dòng)生成式人工智能產(chǎn)業(yè)迅速發(fā)展，在科學(xué)探索、技術(shù)研發(fā)、藝術(shù)創(chuàng)作、企業(yè)經(jīng)營(yíng)等諸多領(lǐng)域都帶來(lái)了巨大的創(chuàng)新機(jī)遇。”中國(guó)工程院院士王恩東說(shuō)。

在供需兩側(cè)的共同推動(dòng)下，技術(shù)創(chuàng)新成果開(kāi)始大規(guī)模地從實(shí)驗(yàn)室研究走向產(chǎn)業(yè)實(shí)踐，人工智能產(chǎn)業(yè)化進(jìn)程不斷加快。據(jù)不完全統(tǒng)計(jì)，截至2023年10月，中國(guó)累計(jì)發(fā)布200余個(gè)人工智能大模型，科研院所和企業(yè)成為開(kāi)發(fā)主力軍。

在華為混合云總裁尚海峰看來(lái)，以人工智能為代表的創(chuàng)新技術(shù)，正在加快重塑各個(gè)行業(yè)。

科技部新一代人工智能發(fā)展研究中心主任趙志耘表示：“人工智能技術(shù)正沿著追求更高精度、挑戰(zhàn)更復(fù)雜任務(wù)、拓展能力邊界等方向持續(xù)演進(jìn)。場(chǎng)景創(chuàng)新成為人工智能技術(shù)升級(jí)、產(chǎn)業(yè)增長(zhǎng)的新路徑。”

浪潮信息高級(jí)副總裁劉軍認(rèn)為，未來(lái)，人工智能還需要進(jìn)一步去深入應(yīng)用場(chǎng)景、賦能具體的產(chǎn)業(yè)環(huán)節(jié)?！斑@個(gè)過(guò)程很難靠一家廠商獨(dú)立完成，需要產(chǎn)業(yè)鏈、創(chuàng)新生態(tài)更多的深度協(xié)同?！眲④娬f(shuō)。

更加通用的人工智能有望實(shí)現(xiàn)

專家表示，以人工智能大模型為代表的人工智能第三發(fā)展階段，未來(lái)會(huì)有一段較長(zhǎng)的發(fā)展紅利期，將成為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量。

中國(guó)科學(xué)院自動(dòng)化研究所對(duì)人工智能大模型的演進(jìn)態(tài)勢(shì)做了研判，曾大軍介紹了其觀點(diǎn)：應(yīng)用和創(chuàng)新生態(tài)正在發(fā)生劇變或至少有劇變的潛質(zhì)，人工智能大模型推動(dòng)決策智能迅猛發(fā)展，人工智能大模型小型化和領(lǐng)域?qū)I(yè)化需求非常迫切，更加通用的人工智能有望實(shí)現(xiàn)。

曾大軍說(shuō)：“人工智能大模型就像一個(gè)人類大腦的雛形，通過(guò)‘喂給’各種數(shù)據(jù)，實(shí)現(xiàn)各種智能能力。人工智能大模型正在重新定義人與計(jì)算機(jī)的互動(dòng)關(guān)系，有望成為人機(jī)交互的主要接口?！?

曾大軍著重強(qiáng)調(diào)了人工智能大模型小型化和領(lǐng)域化的發(fā)展。他表示，現(xiàn)有人工智能大模型的算力和能耗挑戰(zhàn)，會(huì)促使很多工作向領(lǐng)域?qū)Ｓ没?、輕量級(jí)的小模型或大小模型混搭的方向發(fā)展，特別是金融、教育、醫(yī)療、交通等領(lǐng)域，力求降低大模型的成本。

黃鐵軍認(rèn)為人工智能將從信息智能到實(shí)體智能發(fā)展，視覺(jué)、具身人工智能大模型將是下一個(gè)爆發(fā)點(diǎn)。“大數(shù)據(jù)是世界的表達(dá)，從中訓(xùn)練出的語(yǔ)言認(rèn)知模型可以支持信息服務(wù)，語(yǔ)言類大模型能夠提高自動(dòng)駕駛、機(jī)器人等實(shí)體的智能水平，但還需要視覺(jué)、聽(tīng)覺(jué)、具身、交互等技術(shù)的發(fā)展?！?

黃鐵軍告訴記者，目前的智能涌現(xiàn)還只是靜態(tài)涌現(xiàn)，還不具備人腦的動(dòng)態(tài)涌現(xiàn)能力?！拔磥?lái)有望通過(guò)類腦智能實(shí)現(xiàn)真正擁有動(dòng)態(tài)涌現(xiàn)能力的人工智能?！?

2023年，ChatGPT開(kāi)發(fā)者OpenAI被置于前所未有的聚光燈下，也使GPT-4后續(xù)版本的開(kāi)發(fā)被推向了風(fēng)口浪尖。據(jù)消息人士稱，OpenAI正在訓(xùn)練下一代的人工智能，暫名“Q*”(讀作Q-star)。新的一年，OpenAI下一代產(chǎn)品可能發(fā)布。

據(jù)媒體爆料，“Q*”可能是第一次采用“從零開(kāi)始”的方式訓(xùn)練的人工智能。其特點(diǎn)是，智能不來(lái)自人類活動(dòng)的數(shù)據(jù)，且其有能力修改自身代碼以適應(yīng)更復(fù)雜的學(xué)習(xí)任務(wù)。前者使得人工智能能力的發(fā)展變得愈發(fā)不透明，而后者向來(lái)被看作是誕生人工智能“奇點(diǎn)”的必要條件。在人工智能發(fā)展領(lǐng)域，“奇點(diǎn)”特指機(jī)器擁有了自我迭代的能力，進(jìn)而在短時(shí)間內(nèi)迅猛發(fā)展，導(dǎo)致超出人類控制。

雖然一些報(bào)道稱，“Q*”目前還只能解決小學(xué)難度的數(shù)學(xué)問(wèn)題，距離“奇點(diǎn)”還遠(yuǎn)。但鑒于虛擬環(huán)境中人工智能迭代速度可能遠(yuǎn)超想象，其仍然可能在不遠(yuǎn)的將來(lái)自主發(fā)展出在各個(gè)領(lǐng)域均可超過(guò)人類水平的AI。2023年，OpenAI預(yù)言，各方面超越人類水平的人工智能在十年內(nèi)就會(huì)出現(xiàn);英偉達(dá)創(chuàng)始人黃仁勛表示，通用人工智能可能在五年內(nèi)超越人類。

一旦通用人工智能得以實(shí)現(xiàn)，就可被用于解決各種復(fù)雜的科學(xué)難題，譬如尋找外星人與地外宜居星系、人工核聚變控制、納米或超導(dǎo)材料篩選、抗癌藥研發(fā)等。這些問(wèn)題通常需要花費(fèi)人類研究員數(shù)十年的時(shí)間來(lái)尋找新的解決方案，部分前沿領(lǐng)域的研究量已超出人力極限。而通用人工智能在自己的虛擬世界中擁有幾乎無(wú)限的時(shí)間和精力，這使得其在部分容易虛擬化的任務(wù)中，有可能成為人類研究員的替代。但屆時(shí)，人類如何監(jiān)督這些從智能水平上超過(guò)人類的人工智能，確保其不會(huì)危害人類，又是一個(gè)值得思考的問(wèn)題。

當(dāng)然，我們也不應(yīng)過(guò)分高估硅谷巨頭們的部分言論，因?yàn)樵谌斯ぶ悄馨l(fā)展史上，已經(jīng)歷三次“AI寒冬”，其中不乏宏大的技術(shù)愿景因各方面限制化為泡影的例子。但目前可以肯定的是，大模型技術(shù)仍然有著不小的上升空間。除GPT-4外，谷歌的“雙子座”(Gemini)，Anthropic的Claude2，目前都是僅次于GPT-4的大模型，國(guó)內(nèi)的百度“文心一言”與阿里“通義千問(wèn)”，也是國(guó)產(chǎn)大模型中的佼佼者。它們?cè)谛碌囊荒曛惺欠駮?huì)發(fā)布更具革命性的產(chǎn)品，同樣值得期待。

趨勢(shì)二：合成數(shù)據(jù)打破人工智能訓(xùn)練數(shù)據(jù)瓶頸

數(shù)據(jù)瓶頸指的是可用于訓(xùn)練AI的高質(zhì)量數(shù)據(jù)的有限性，合成數(shù)據(jù)有望打破這一瓶頸。

合成數(shù)據(jù)是在模仿真實(shí)數(shù)據(jù)的基礎(chǔ)上，由機(jī)器學(xué)習(xí)模型利用數(shù)學(xué)和統(tǒng)計(jì)科學(xué)原理合成的數(shù)據(jù)。關(guān)于什么是合成數(shù)據(jù)，有一個(gè)較為淺顯易懂的比喻：這就像是在給AI編寫專門的教材。例如，盡管英文課本的對(duì)話中出現(xiàn)的可能是“小明”“小紅”這樣的虛構(gòu)人名，但并不影響學(xué)生們由此掌握英語(yǔ)，因此從某種意義上，對(duì)于學(xué)生而言，教材就可以看作一種經(jīng)過(guò)編纂、篩選和處理的“合成數(shù)據(jù)”。

有論文表明，模型的規(guī)模至少要達(dá)到620億參數(shù)量后，才可能訓(xùn)練出“思維鏈”能力，即進(jìn)行分步驟的邏輯推理。但現(xiàn)實(shí)的尷尬在于，迄今為止人類產(chǎn)生的不重復(fù)的、可供訓(xùn)練的優(yōu)質(zhì)數(shù)據(jù)并沒(méi)有這么多。使用ChatGPT等生成式人工智能以前所未有的數(shù)量產(chǎn)生高質(zhì)量合成數(shù)據(jù)，未來(lái)的AI將由此獲得更高的性能。

除了對(duì)大量高質(zhì)量數(shù)據(jù)的需求導(dǎo)致合成數(shù)據(jù)受到追捧以外，對(duì)數(shù)據(jù)安全的考量也是重要原因。近年來(lái)，各國(guó)紛紛出臺(tái)更嚴(yán)格的數(shù)據(jù)安全保護(hù)法律，使得客觀上利用人類產(chǎn)生的數(shù)據(jù)訓(xùn)練人工智能變得更為繁瑣。這些數(shù)據(jù)中不僅可能隱含個(gè)人信息，其中的許多數(shù)據(jù)還受版權(quán)保護(hù)。在互聯(lián)網(wǎng)隱私與版權(quán)保護(hù)尚未形成統(tǒng)一標(biāo)準(zhǔn)與完善架構(gòu)的當(dāng)下，使用互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行訓(xùn)練，極易導(dǎo)致大量法律糾紛。而若考慮對(duì)這些數(shù)據(jù)進(jìn)行脫敏，又面臨篩查識(shí)別準(zhǔn)確率方面的挑戰(zhàn)。兩難之下，合成數(shù)據(jù)就成為最惠而不費(fèi)的一種選擇。

此外，使用人類數(shù)據(jù)進(jìn)行訓(xùn)練，還可能導(dǎo)致人工智能學(xué)到有害內(nèi)容。一些諸如使用日用品制造炸彈、管制化學(xué)品的方法，另一些則包括許多人工智能本不應(yīng)當(dāng)出現(xiàn)的壞習(xí)慣，譬如像人一樣在任務(wù)執(zhí)行過(guò)程中偷懶、為了取悅用戶而說(shuō)謊、產(chǎn)生偏見(jiàn)和歧視。若改用合成數(shù)據(jù)，使人工智能在訓(xùn)練中盡可能減少接觸有害內(nèi)容，則有望克服以上使用人類數(shù)據(jù)訓(xùn)練時(shí)附帶的缺點(diǎn)。

從以上分析中可以看出，合成數(shù)據(jù)可以說(shuō)是頗具開(kāi)創(chuàng)性的，有望解決此前發(fā)展人工智能與數(shù)據(jù)隱私保護(hù)不可得兼的問(wèn)題。但與此同時(shí)，如何確保相關(guān)的公司和機(jī)構(gòu)負(fù)責(zé)任地制作合成數(shù)據(jù)，如何制作出既符合本國(guó)文化與價(jià)值觀，又在規(guī)模和技術(shù)水平上足以媲美西方以英文網(wǎng)絡(luò)資料為中心的合成數(shù)據(jù)訓(xùn)練集，也將成為中國(guó)面臨的一個(gè)頗具挑戰(zhàn)性的課題。

除此之外，合成數(shù)據(jù)帶來(lái)的一個(gè)重大變化是，來(lái)自人類社會(huì)的大數(shù)據(jù)或?qū)⒉辉偈茿I訓(xùn)練所必需。在今后的數(shù)字世界中，人類數(shù)據(jù)的產(chǎn)生、存儲(chǔ)和使用仍將遵循人類社會(huì)的法則和秩序，包括維護(hù)國(guó)家數(shù)據(jù)安全、保守商業(yè)數(shù)據(jù)秘密和尊重個(gè)人數(shù)據(jù)隱私，而AI訓(xùn)練所需的合成數(shù)據(jù)則采用另一套標(biāo)準(zhǔn)進(jìn)行管理。

趨勢(shì)三：量子計(jì)算機(jī)可能率先應(yīng)用于人工智能

作為電子計(jì)算機(jī)發(fā)展到今天的最前沿應(yīng)用，人工智能始終存在算力不足的隱憂。ChatGPT問(wèn)世數(shù)月后，OpenAI總裁奧爾特曼曾公開(kāi)表示，其并未鼓勵(lì)更多用戶注冊(cè)O(shè)penAI。2023年11月，OpenAI甚至宣布暫停ChatGPT Plus付費(fèi)訂閱新用戶的注冊(cè)，以確?，F(xiàn)有用戶擁有高質(zhì)量體驗(yàn)。顯然，作為全球性能最強(qiáng)的AI，ChatGPT已遇到算力等方面的瓶頸。在此背景下，討論量子計(jì)算機(jī)在人工智能領(lǐng)域的應(yīng)用就成為一種頗具潛力的未來(lái)解決方案。

首先，人工智能領(lǐng)域的算法，大部分屬于并行計(jì)算的范疇。舉例而言，AlphaGo在下圍棋的過(guò)程中，其需要同時(shí)考慮對(duì)手在不同位置落子后的應(yīng)對(duì)招數(shù)，從中找到最有可能贏得棋局的下法。這就需要計(jì)算機(jī)優(yōu)化并行計(jì)算的效率來(lái)實(shí)現(xiàn)。而量子計(jì)算機(jī)擅長(zhǎng)進(jìn)行并行計(jì)算，因?yàn)樗梢酝瑫r(shí)計(jì)算和存儲(chǔ)“0”和“1”兩種狀態(tài)，無(wú)需像電子計(jì)算機(jī)那樣消耗額外的計(jì)算資源，譬如串聯(lián)多個(gè)計(jì)算單元，或?qū)⒂?jì)算任務(wù)在時(shí)間上并列。計(jì)算任務(wù)越復(fù)雜，量子計(jì)算就越具備優(yōu)勢(shì)。

盡管生成式人工智能可能淘汰掉一批傳統(tǒng)數(shù)字崗位，但在關(guān)上一扇門的同時(shí)也打開(kāi)了一扇窗，這就是“無(wú)代碼軟件開(kāi)發(fā)”。目前，以AI大模型為基礎(chǔ)的編程輔助工具已經(jīng)發(fā)展到一個(gè)新的階段，能夠根據(jù)用戶十分模糊的指令來(lái)生成軟件或網(wǎng)頁(yè)代碼。例如，2023年的GPT-4演示中，演示人員僅僅是在A4紙上手寫了一個(gè)十分潦草的結(jié)構(gòu)示意圖，GPT-4就根據(jù)其自動(dòng)生成了能夠?qū)嶋H訪問(wèn)的網(wǎng)頁(yè)。這無(wú)疑大大降低了開(kāi)發(fā)IT服務(wù)的門檻。只要一個(gè)人有足夠有創(chuàng)意的、能夠滿足許多人需求的數(shù)字服務(wù)“點(diǎn)子”，就可以成為互聯(lián)網(wǎng)創(chuàng)新的風(fēng)口，“人人皆可創(chuàng)新”的時(shí)代已然到來(lái)。

對(duì)此，政府需轉(zhuǎn)變觀念，兼顧市場(chǎng)監(jiān)管與促進(jìn)創(chuàng)新，一方面，降低數(shù)字創(chuàng)新過(guò)程中的注冊(cè)與融資門檻，打通中小企業(yè)發(fā)展壯大過(guò)程中的痛點(diǎn)，讓就業(yè)與創(chuàng)新政策適應(yīng)“人人皆可創(chuàng)新”的新需求;另一方面，需要探索更有利于保護(hù)創(chuàng)新的版權(quán)與專利保護(hù)新政策，從而激勵(lì)那些能夠不斷提出創(chuàng)新的人才。

綜上所述，展望2024年，無(wú)論是人工智能技術(shù)自身的迭代發(fā)展，還是其對(duì)數(shù)據(jù)價(jià)值的重塑，抑或是向各行業(yè)、各領(lǐng)域的應(yīng)用滲透，人工智能的影響可謂無(wú)處不在，既為科研、創(chuàng)新和經(jīng)濟(jì)賦能，又帶來(lái)新的挑戰(zhàn)與風(fēng)險(xiǎn)。我們應(yīng)以開(kāi)放的心態(tài)看待人工智能帶來(lái)的諸多改變，審慎研究和應(yīng)對(duì)其可能帶來(lái)的新課題與新風(fēng)險(xiǎn)。