簡(jiǎn)述人工智能未來(lái)的發(fā)展趨勢(shì)
2023年10月18日,中國(guó)在第三屆“一帶一路”國(guó)際合作高峰論壇期間發(fā)布《全球人工智能治理倡議》,圍繞人工智能發(fā)展、安全、治理三方面系統(tǒng)闡述了人工智能治理中國(guó)方案。
近年來(lái),全球人工智能技術(shù)快速發(fā)展,成為推動(dòng)科技和產(chǎn)業(yè)加速發(fā)展的重要力量,對(duì)經(jīng)濟(jì)社會(huì)發(fā)展和人類文明進(jìn)步產(chǎn)生深遠(yuǎn)影響。人工智能技術(shù)發(fā)展現(xiàn)狀如何?有哪些應(yīng)用?未來(lái)趨勢(shì)怎樣?記者采訪了相關(guān)專家。
人工智能處理復(fù)雜任務(wù)的能力大為提升
當(dāng)前,人工智能技術(shù)已進(jìn)入實(shí)用階段,正深刻地改變著人類的生產(chǎn)生活。
“近70年的發(fā)展歷程中,人工智能經(jīng)歷了灌輸規(guī)則、灌輸知識(shí)、從數(shù)據(jù)中學(xué)習(xí)這三個(gè)階段。近年來(lái)在全球迅速發(fā)展的人工智能大模型技術(shù),其依托的基本模型都基于‘大數(shù)據(jù)+大算力+強(qiáng)算法’訓(xùn)練,這是人工智能發(fā)展第三階段的典型體現(xiàn)。”北京智源人工智能研究院院長(zhǎng)黃鐵軍說(shuō)。
目前,各類人工智能大模型處于迅猛發(fā)展之中,全球眾多高科技企業(yè)紛紛投身人工智能大模型建設(shè)。
“現(xiàn)在圍繞人工智能大模型已形成相對(duì)成熟的技術(shù)框架,但產(chǎn)品和生態(tài)尚在發(fā)展形成之中。”中國(guó)科學(xué)院自動(dòng)化研究所副所長(zhǎng)、研究員曾大軍說(shuō),“總體而言,人工智能大模型的技術(shù)發(fā)展歷程相比以往任何人工智能技術(shù)都更為迅猛,其影響力也是史無(wú)前例的?!?
人工智能大模型的出現(xiàn),為通用人工智能的實(shí)現(xiàn)打開(kāi)了新的想象空間,大大提升了人工智能處理復(fù)雜任務(wù)的能力。
“比如,基于人工智能大語(yǔ)言模型的聊天機(jī)器人能夠?qū)崿F(xiàn)高質(zhì)量的信息整合、翻譯和簡(jiǎn)單問(wèn)題求解與規(guī)劃?!痹筌娬f(shuō),“這類機(jī)器人受到關(guān)注,主要是因?yàn)槠湟殉醪骄邆渫ㄓ萌斯ぶ悄艿牟糠痔匦?,包括通順的自然語(yǔ)言生成、全領(lǐng)域的知識(shí)體系覆蓋、跨任務(wù)場(chǎng)景的通用處理模型、通暢的人機(jī)交互接口。”
不過(guò),目前人工智能大模型能力仍有局限性。
“一方面,由于人工智能大模型自身結(jié)構(gòu)和機(jī)制漏洞,有被惡意攻擊的風(fēng)險(xiǎn);另一方面,人工智能大模型自身的知識(shí)表達(dá)和學(xué)習(xí)模式還存在缺陷,導(dǎo)致其回答會(huì)有常識(shí)性錯(cuò)誤、杜撰內(nèi)容等?!痹筌娬f(shuō),“人工智能學(xué)者們正在圍繞這些問(wèn)題進(jìn)行攻關(guān)。”
人工智能加速邁向全面應(yīng)用新階段
“我是剛?cè)雽W(xué)的大一計(jì)算機(jī)專業(yè)學(xué)生,想選修人工智能課程,需要做什么準(zhǔn)備?”“你需要學(xué)習(xí)基礎(chǔ)數(shù)學(xué)知識(shí)、編程語(yǔ)言,學(xué)習(xí)機(jī)器學(xué)習(xí)算法,關(guān)注技術(shù)趨勢(shì)……”這段對(duì)話并非出自師生之間,而是學(xué)生與人工智能之間的問(wèn)答。
2023年8月,浙江大學(xué)聯(lián)合高等教育出版社等發(fā)布“智?!龢?lè)”教育垂直大模型,在核心教材、領(lǐng)域論文和學(xué)位論文等語(yǔ)料和專業(yè)指令數(shù)據(jù)集的基礎(chǔ)上,可提供智能問(wèn)答、試題生成、學(xué)習(xí)導(dǎo)航、教學(xué)評(píng)估等服務(wù),現(xiàn)已在多所高校應(yīng)用。
“我們把這些教材拆成語(yǔ)句、段落、篇章去‘喂給’大模型,這些高質(zhì)量的語(yǔ)料會(huì)合成詞與詞之間的概率關(guān)聯(lián),給學(xué)生以啟迪?!闭憬髮W(xué)教授吳飛說(shuō)。
工業(yè)質(zhì)檢、知識(shí)管理、代碼生成、語(yǔ)音交互……當(dāng)前,中國(guó)人工智能正從單點(diǎn)應(yīng)用向多元化應(yīng)用、從通用場(chǎng)景向行業(yè)特定場(chǎng)景不斷深入,加速邁向全面應(yīng)用新階段。特別是隨著人工智能大模型的突破和生成式人工智能的興起,人工智能得以更好處理生產(chǎn)生活中的復(fù)雜問(wèn)題,為各行業(yè)實(shí)現(xiàn)產(chǎn)品和流程革新提供了更加先進(jìn)的工具和手段。
預(yù)測(cè)一個(gè)臺(tái)風(fēng)未來(lái)10天的路徑,過(guò)去需要在3000臺(tái)服務(wù)器上花費(fèi)5小時(shí)進(jìn)行仿真,現(xiàn)在基于預(yù)訓(xùn)練的盤古氣象大模型,10秒內(nèi)就可以獲得更精確的預(yù)測(cè)結(jié)果;字?jǐn)?shù)將近4000萬(wàn)的一套古籍,研究人員利用人工智能,3個(gè)多月就完成了識(shí)別、點(diǎn)校、上線發(fā)布……
“人工智能大模型帶動(dòng)生成式人工智能產(chǎn)業(yè)迅速發(fā)展,在科學(xué)探索、技術(shù)研發(fā)、藝術(shù)創(chuàng)作、企業(yè)經(jīng)營(yíng)等諸多領(lǐng)域都帶來(lái)了巨大的創(chuàng)新機(jī)遇。”中國(guó)工程院院士王恩東說(shuō)。
在供需兩側(cè)的共同推動(dòng)下,技術(shù)創(chuàng)新成果開(kāi)始大規(guī)模地從實(shí)驗(yàn)室研究走向產(chǎn)業(yè)實(shí)踐,人工智能產(chǎn)業(yè)化進(jìn)程不斷加快。據(jù)不完全統(tǒng)計(jì),截至2023年10月,中國(guó)累計(jì)發(fā)布200余個(gè)人工智能大模型,科研院所和企業(yè)成為開(kāi)發(fā)主力軍。
在華為混合云總裁尚海峰看來(lái),以人工智能為代表的創(chuàng)新技術(shù),正在加快重塑各個(gè)行業(yè)。
科技部新一代人工智能發(fā)展研究中心主任趙志耘表示:“人工智能技術(shù)正沿著追求更高精度、挑戰(zhàn)更復(fù)雜任務(wù)、拓展能力邊界等方向持續(xù)演進(jìn)。場(chǎng)景創(chuàng)新成為人工智能技術(shù)升級(jí)、產(chǎn)業(yè)增長(zhǎng)的新路徑。”
浪潮信息高級(jí)副總裁劉軍認(rèn)為,未來(lái),人工智能還需要進(jìn)一步去深入應(yīng)用場(chǎng)景、賦能具體的產(chǎn)業(yè)環(huán)節(jié)?!斑@個(gè)過(guò)程很難靠一家廠商獨(dú)立完成,需要產(chǎn)業(yè)鏈、創(chuàng)新生態(tài)更多的深度協(xié)同?!眲④娬f(shuō)。
更加通用的人工智能有望實(shí)現(xiàn)
專家表示,以人工智能大模型為代表的人工智能第三發(fā)展階段,未來(lái)會(huì)有一段較長(zhǎng)的發(fā)展紅利期,將成為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量。
中國(guó)科學(xué)院自動(dòng)化研究所對(duì)人工智能大模型的演進(jìn)態(tài)勢(shì)做了研判,曾大軍介紹了其觀點(diǎn):應(yīng)用和創(chuàng)新生態(tài)正在發(fā)生劇變或至少有劇變的潛質(zhì),人工智能大模型推動(dòng)決策智能迅猛發(fā)展,人工智能大模型小型化和領(lǐng)域?qū)I(yè)化需求非常迫切,更加通用的人工智能有望實(shí)現(xiàn)。
曾大軍說(shuō):“人工智能大模型就像一個(gè)人類大腦的雛形,通過(guò)‘喂給’各種數(shù)據(jù),實(shí)現(xiàn)各種智能能力。人工智能大模型正在重新定義人與計(jì)算機(jī)的互動(dòng)關(guān)系,有望成為人機(jī)交互的主要接口?!?
曾大軍著重強(qiáng)調(diào)了人工智能大模型小型化和領(lǐng)域化的發(fā)展。他表示,現(xiàn)有人工智能大模型的算力和能耗挑戰(zhàn),會(huì)促使很多工作向領(lǐng)域?qū)S没?、輕量級(jí)的小模型或大小模型混搭的方向發(fā)展,特別是金融、教育、醫(yī)療、交通等領(lǐng)域,力求降低大模型的成本。
黃鐵軍認(rèn)為人工智能將從信息智能到實(shí)體智能發(fā)展,視覺(jué)、具身人工智能大模型將是下一個(gè)爆發(fā)點(diǎn)。“大數(shù)據(jù)是世界的表達(dá),從中訓(xùn)練出的語(yǔ)言認(rèn)知模型可以支持信息服務(wù),語(yǔ)言類大模型能夠提高自動(dòng)駕駛、機(jī)器人等實(shí)體的智能水平,但還需要視覺(jué)、聽(tīng)覺(jué)、具身、交互等技術(shù)的發(fā)展?!?
黃鐵軍告訴記者,目前的智能涌現(xiàn)還只是靜態(tài)涌現(xiàn),還不具備人腦的動(dòng)態(tài)涌現(xiàn)能力?!拔磥?lái)有望通過(guò)類腦智能實(shí)現(xiàn)真正擁有動(dòng)態(tài)涌現(xiàn)能力的人工智能?!?
2023年,ChatGPT開(kāi)發(fā)者OpenAI被置于前所未有的聚光燈下,也使GPT-4后續(xù)版本的開(kāi)發(fā)被推向了風(fēng)口浪尖。據(jù)消息人士稱,OpenAI正在訓(xùn)練下一代的人工智能,暫名“Q*”(讀作Q-star)。新的一年,OpenAI下一代產(chǎn)品可能發(fā)布。
據(jù)媒體爆料,“Q*”可能是第一次采用“從零開(kāi)始”的方式訓(xùn)練的人工智能。其特點(diǎn)是,智能不來(lái)自人類活動(dòng)的數(shù)據(jù),且其有能力修改自身代碼以適應(yīng)更復(fù)雜的學(xué)習(xí)任務(wù)。前者使得人工智能能力的發(fā)展變得愈發(fā)不透明,而后者向來(lái)被看作是誕生人工智能“奇點(diǎn)”的必要條件。在人工智能發(fā)展領(lǐng)域,“奇點(diǎn)”特指機(jī)器擁有了自我迭代的能力,進(jìn)而在短時(shí)間內(nèi)迅猛發(fā)展,導(dǎo)致超出人類控制。
雖然一些報(bào)道稱,“Q*”目前還只能解決小學(xué)難度的數(shù)學(xué)問(wèn)題,距離“奇點(diǎn)”還遠(yuǎn)。但鑒于虛擬環(huán)境中人工智能迭代速度可能遠(yuǎn)超想象,其仍然可能在不遠(yuǎn)的將來(lái)自主發(fā)展出在各個(gè)領(lǐng)域均可超過(guò)人類水平的AI。2023年,OpenAI預(yù)言,各方面超越人類水平的人工智能在十年內(nèi)就會(huì)出現(xiàn);英偉達(dá)創(chuàng)始人黃仁勛表示,通用人工智能可能在五年內(nèi)超越人類。
一旦通用人工智能得以實(shí)現(xiàn),就可被用于解決各種復(fù)雜的科學(xué)難題,譬如尋找外星人與地外宜居星系、人工核聚變控制、納米或超導(dǎo)材料篩選、抗癌藥研發(fā)等。這些問(wèn)題通常需要花費(fèi)人類研究員數(shù)十年的時(shí)間來(lái)尋找新的解決方案,部分前沿領(lǐng)域的研究量已超出人力極限。而通用人工智能在自己的虛擬世界中擁有幾乎無(wú)限的時(shí)間和精力,這使得其在部分容易虛擬化的任務(wù)中,有可能成為人類研究員的替代。但屆時(shí),人類如何監(jiān)督這些從智能水平上超過(guò)人類的人工智能,確保其不會(huì)危害人類,又是一個(gè)值得思考的問(wèn)題。
當(dāng)然,我們也不應(yīng)過(guò)分高估硅谷巨頭們的部分言論,因?yàn)樵谌斯ぶ悄馨l(fā)展史上,已經(jīng)歷三次“AI寒冬”,其中不乏宏大的技術(shù)愿景因各方面限制化為泡影的例子。但目前可以肯定的是,大模型技術(shù)仍然有著不小的上升空間。除GPT-4外,谷歌的“雙子座”(Gemini),Anthropic的Claude2,目前都是僅次于GPT-4的大模型,國(guó)內(nèi)的百度“文心一言”與阿里“通義千問(wèn)”,也是國(guó)產(chǎn)大模型中的佼佼者。它們?cè)谛碌囊荒曛惺欠駮?huì)發(fā)布更具革命性的產(chǎn)品,同樣值得期待。
趨勢(shì)二:合成數(shù)據(jù)打破人工智能訓(xùn)練數(shù)據(jù)瓶頸
數(shù)據(jù)瓶頸指的是可用于訓(xùn)練AI的高質(zhì)量數(shù)據(jù)的有限性,合成數(shù)據(jù)有望打破這一瓶頸。
合成數(shù)據(jù)是在模仿真實(shí)數(shù)據(jù)的基礎(chǔ)上,由機(jī)器學(xué)習(xí)模型利用數(shù)學(xué)和統(tǒng)計(jì)科學(xué)原理合成的數(shù)據(jù)。關(guān)于什么是合成數(shù)據(jù),有一個(gè)較為淺顯易懂的比喻:這就像是在給AI編寫專門的教材。例如,盡管英文課本的對(duì)話中出現(xiàn)的可能是“小明”“小紅”這樣的虛構(gòu)人名,但并不影響學(xué)生們由此掌握英語(yǔ),因此從某種意義上,對(duì)于學(xué)生而言,教材就可以看作一種經(jīng)過(guò)編纂、篩選和處理的“合成數(shù)據(jù)”。
有論文表明,模型的規(guī)模至少要達(dá)到620億參數(shù)量后,才可能訓(xùn)練出“思維鏈”能力,即進(jìn)行分步驟的邏輯推理。但現(xiàn)實(shí)的尷尬在于,迄今為止人類產(chǎn)生的不重復(fù)的、可供訓(xùn)練的優(yōu)質(zhì)數(shù)據(jù)并沒(méi)有這么多。使用ChatGPT等生成式人工智能以前所未有的數(shù)量產(chǎn)生高質(zhì)量合成數(shù)據(jù),未來(lái)的AI將由此獲得更高的性能。
除了對(duì)大量高質(zhì)量數(shù)據(jù)的需求導(dǎo)致合成數(shù)據(jù)受到追捧以外,對(duì)數(shù)據(jù)安全的考量也是重要原因。近年來(lái),各國(guó)紛紛出臺(tái)更嚴(yán)格的數(shù)據(jù)安全保護(hù)法律,使得客觀上利用人類產(chǎn)生的數(shù)據(jù)訓(xùn)練人工智能變得更為繁瑣。這些數(shù)據(jù)中不僅可能隱含個(gè)人信息,其中的許多數(shù)據(jù)還受版權(quán)保護(hù)。在互聯(lián)網(wǎng)隱私與版權(quán)保護(hù)尚未形成統(tǒng)一標(biāo)準(zhǔn)與完善架構(gòu)的當(dāng)下,使用互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行訓(xùn)練,極易導(dǎo)致大量法律糾紛。而若考慮對(duì)這些數(shù)據(jù)進(jìn)行脫敏,又面臨篩查識(shí)別準(zhǔn)確率方面的挑戰(zhàn)。兩難之下,合成數(shù)據(jù)就成為最惠而不費(fèi)的一種選擇。
此外,使用人類數(shù)據(jù)進(jìn)行訓(xùn)練,還可能導(dǎo)致人工智能學(xué)到有害內(nèi)容。一些諸如使用日用品制造炸彈、管制化學(xué)品的方法,另一些則包括許多人工智能本不應(yīng)當(dāng)出現(xiàn)的壞習(xí)慣,譬如像人一樣在任務(wù)執(zhí)行過(guò)程中偷懶、為了取悅用戶而說(shuō)謊、產(chǎn)生偏見(jiàn)和歧視。若改用合成數(shù)據(jù),使人工智能在訓(xùn)練中盡可能減少接觸有害內(nèi)容,則有望克服以上使用人類數(shù)據(jù)訓(xùn)練時(shí)附帶的缺點(diǎn)。
從以上分析中可以看出,合成數(shù)據(jù)可以說(shuō)是頗具開(kāi)創(chuàng)性的,有望解決此前發(fā)展人工智能與數(shù)據(jù)隱私保護(hù)不可得兼的問(wèn)題。但與此同時(shí),如何確保相關(guān)的公司和機(jī)構(gòu)負(fù)責(zé)任地制作合成數(shù)據(jù),如何制作出既符合本國(guó)文化與價(jià)值觀,又在規(guī)模和技術(shù)水平上足以媲美西方以英文網(wǎng)絡(luò)資料為中心的合成數(shù)據(jù)訓(xùn)練集,也將成為中國(guó)面臨的一個(gè)頗具挑戰(zhàn)性的課題。
除此之外,合成數(shù)據(jù)帶來(lái)的一個(gè)重大變化是,來(lái)自人類社會(huì)的大數(shù)據(jù)或?qū)⒉辉偈茿I訓(xùn)練所必需。在今后的數(shù)字世界中,人類數(shù)據(jù)的產(chǎn)生、存儲(chǔ)和使用仍將遵循人類社會(huì)的法則和秩序,包括維護(hù)國(guó)家數(shù)據(jù)安全、保守商業(yè)數(shù)據(jù)秘密和尊重個(gè)人數(shù)據(jù)隱私,而AI訓(xùn)練所需的合成數(shù)據(jù)則采用另一套標(biāo)準(zhǔn)進(jìn)行管理。
趨勢(shì)三:量子計(jì)算機(jī)可能率先應(yīng)用于人工智能
作為電子計(jì)算機(jī)發(fā)展到今天的最前沿應(yīng)用,人工智能始終存在算力不足的隱憂。ChatGPT問(wèn)世數(shù)月后,OpenAI總裁奧爾特曼曾公開(kāi)表示,其并未鼓勵(lì)更多用戶注冊(cè)O(shè)penAI。2023年11月,OpenAI甚至宣布暫停ChatGPT Plus付費(fèi)訂閱新用戶的注冊(cè),以確?,F(xiàn)有用戶擁有高質(zhì)量體驗(yàn)。顯然,作為全球性能最強(qiáng)的AI,ChatGPT已遇到算力等方面的瓶頸。在此背景下,討論量子計(jì)算機(jī)在人工智能領(lǐng)域的應(yīng)用就成為一種頗具潛力的未來(lái)解決方案。
首先,人工智能領(lǐng)域的算法,大部分屬于并行計(jì)算的范疇。舉例而言,AlphaGo在下圍棋的過(guò)程中,其需要同時(shí)考慮對(duì)手在不同位置落子后的應(yīng)對(duì)招數(shù),從中找到最有可能贏得棋局的下法。這就需要計(jì)算機(jī)優(yōu)化并行計(jì)算的效率來(lái)實(shí)現(xiàn)。而量子計(jì)算機(jī)擅長(zhǎng)進(jìn)行并行計(jì)算,因?yàn)樗梢酝瑫r(shí)計(jì)算和存儲(chǔ)“0”和“1”兩種狀態(tài),無(wú)需像電子計(jì)算機(jī)那樣消耗額外的計(jì)算資源,譬如串聯(lián)多個(gè)計(jì)算單元,或?qū)⒂?jì)算任務(wù)在時(shí)間上并列。計(jì)算任務(wù)越復(fù)雜,量子計(jì)算就越具備優(yōu)勢(shì)。
盡管生成式人工智能可能淘汰掉一批傳統(tǒng)數(shù)字崗位,但在關(guān)上一扇門的同時(shí)也打開(kāi)了一扇窗,這就是“無(wú)代碼軟件開(kāi)發(fā)”。目前,以AI大模型為基礎(chǔ)的編程輔助工具已經(jīng)發(fā)展到一個(gè)新的階段,能夠根據(jù)用戶十分模糊的指令來(lái)生成軟件或網(wǎng)頁(yè)代碼。例如,2023年的GPT-4演示中,演示人員僅僅是在A4紙上手寫了一個(gè)十分潦草的結(jié)構(gòu)示意圖,GPT-4就根據(jù)其自動(dòng)生成了能夠?qū)嶋H訪問(wèn)的網(wǎng)頁(yè)。這無(wú)疑大大降低了開(kāi)發(fā)IT服務(wù)的門檻。只要一個(gè)人有足夠有創(chuàng)意的、能夠滿足許多人需求的數(shù)字服務(wù)“點(diǎn)子”,就可以成為互聯(lián)網(wǎng)創(chuàng)新的風(fēng)口,“人人皆可創(chuàng)新”的時(shí)代已然到來(lái)。
對(duì)此,政府需轉(zhuǎn)變觀念,兼顧市場(chǎng)監(jiān)管與促進(jìn)創(chuàng)新,一方面,降低數(shù)字創(chuàng)新過(guò)程中的注冊(cè)與融資門檻,打通中小企業(yè)發(fā)展壯大過(guò)程中的痛點(diǎn),讓就業(yè)與創(chuàng)新政策適應(yīng)“人人皆可創(chuàng)新”的新需求;另一方面,需要探索更有利于保護(hù)創(chuàng)新的版權(quán)與專利保護(hù)新政策,從而激勵(lì)那些能夠不斷提出創(chuàng)新的人才。
綜上所述,展望2024年,無(wú)論是人工智能技術(shù)自身的迭代發(fā)展,還是其對(duì)數(shù)據(jù)價(jià)值的重塑,抑或是向各行業(yè)、各領(lǐng)域的應(yīng)用滲透,人工智能的影響可謂無(wú)處不在,既為科研、創(chuàng)新和經(jīng)濟(jì)賦能,又帶來(lái)新的挑戰(zhàn)與風(fēng)險(xiǎn)。我們應(yīng)以開(kāi)放的心態(tài)看待人工智能帶來(lái)的諸多改變,審慎研究和應(yīng)對(duì)其可能帶來(lái)的新課題與新風(fēng)險(xiǎn)。