人工智能有哪些技術(shù)和方法?人工智能訓(xùn)練數(shù)據(jù)瓶頸將被打破!
對(duì)于人工智能AI,想必大家都已經(jīng)有所耳聞。在現(xiàn)在的應(yīng)用中,其實(shí)很多都是人工智能的體現(xiàn),比如自動(dòng)駕駛便是人工智能的分支之一。為增進(jìn)大家對(duì)人工智能的認(rèn)識(shí),本文將對(duì)人工智能的技術(shù)和方法,以及人工智能的趨勢(shì)予以介紹。如果你對(duì)人工智能具有興趣,不妨繼續(xù)往下閱讀哦。
一、人工智能包括哪些
人工智能的技術(shù)和方法主要包括以下幾個(gè)方面:
? 機(jī)器學(xué)習(xí):是指讓機(jī)器或系統(tǒng)能夠從數(shù)據(jù)中自動(dòng)學(xué)習(xí)和提升的技術(shù),包括監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等。機(jī)器學(xué)習(xí)是人工智能的核心技術(shù),也是目前人工智能的主流方法。
? 深度學(xué)習(xí):是指利用多層的人工神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)機(jī)器學(xué)習(xí)的技術(shù),包括卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、生成對(duì)抗網(wǎng)絡(luò)、變分自編碼器等。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)重要分支,也是目前人工智能的熱門(mén)方向。
? 自然語(yǔ)言處理:是指讓機(jī)器或系統(tǒng)能夠理解和生成自然語(yǔ)言的技術(shù),包括語(yǔ)音識(shí)別、語(yǔ)音合成、自然語(yǔ)言理解、自然語(yǔ)言生成、機(jī)器翻譯、問(wèn)答系統(tǒng)、對(duì)話(huà)系統(tǒng)等。自然語(yǔ)言處理是人工智能的一個(gè)重要應(yīng)用領(lǐng)域,也是目前人工智能的難點(diǎn)方向。
? 計(jì)算機(jī)視覺(jué):是指讓機(jī)器或系統(tǒng)能夠感知和理解圖像和視頻的技術(shù),包括圖像識(shí)別、圖像分割、圖像檢索、人臉識(shí)別、目標(biāo)檢測(cè)、目標(biāo)跟蹤、場(chǎng)景理解、圖像生成等。計(jì)算機(jī)視覺(jué)是人工智能的一個(gè)重要應(yīng)用領(lǐng)域,也是目前人工智能的熱點(diǎn)方向。
? 機(jī)器人:是指能夠模擬或擴(kuò)展人類(lèi)的行為和功能的機(jī)器或系統(tǒng),包括機(jī)械臂、移動(dòng)機(jī)器人、服務(wù)機(jī)器人、智能玩具、無(wú)人駕駛等。機(jī)器人是人工智能的一個(gè)重要應(yīng)用領(lǐng)域,也是目前人工智能的前沿方向。
二、人工智能趨勢(shì)-合成數(shù)據(jù)打破人工智能訓(xùn)練數(shù)據(jù)瓶頸
數(shù)據(jù)瓶頸指的是可用于訓(xùn)練AI的高質(zhì)量數(shù)據(jù)的有限性,合成數(shù)據(jù)有望打破這一瓶頸。
合成數(shù)據(jù)是在模仿真實(shí)數(shù)據(jù)的基礎(chǔ)上,由機(jī)器學(xué)習(xí)模型利用數(shù)學(xué)和統(tǒng)計(jì)科學(xué)原理合成的數(shù)據(jù)。關(guān)于什么是合成數(shù)據(jù),有一個(gè)較為淺顯易懂的比喻:這就像是在給AI編寫(xiě)專(zhuān)門(mén)的教材。例如,盡管英文課本的對(duì)話(huà)中出現(xiàn)的可能是“小明”“小紅”這樣的虛構(gòu)人名,但并不影響學(xué)生們由此掌握英語(yǔ),因此從某種意義上,對(duì)于學(xué)生而言,教材就可以看作一種經(jīng)過(guò)編纂、篩選和處理的“合成數(shù)據(jù)”。
有論文表明,模型的規(guī)模至少要達(dá)到620億參數(shù)量后,才可能訓(xùn)練出“思維鏈”能力,即進(jìn)行分步驟的邏輯推理。但現(xiàn)實(shí)的尷尬在于,迄今為止人類(lèi)產(chǎn)生的不重復(fù)的、可供訓(xùn)練的優(yōu)質(zhì)數(shù)據(jù)并沒(méi)有這么多。使用ChatGPT等生成式人工智能以前所未有的數(shù)量產(chǎn)生高質(zhì)量合成數(shù)據(jù),未來(lái)的AI將由此獲得更高的性能。
除了對(duì)大量高質(zhì)量數(shù)據(jù)的需求導(dǎo)致合成數(shù)據(jù)受到追捧以外,對(duì)數(shù)據(jù)安全的考量也是重要原因。近年來(lái),各國(guó)紛紛出臺(tái)更嚴(yán)格的數(shù)據(jù)安全保護(hù)法律,使得客觀上利用人類(lèi)產(chǎn)生的數(shù)據(jù)訓(xùn)練人工智能變得更為繁瑣。這些數(shù)據(jù)中不僅可能隱含個(gè)人信息,其中的許多數(shù)據(jù)還受版權(quán)保護(hù)。在互聯(lián)網(wǎng)隱私與版權(quán)保護(hù)尚未形成統(tǒng)一標(biāo)準(zhǔn)與完善架構(gòu)的當(dāng)下,使用互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行訓(xùn)練,極易導(dǎo)致大量法律糾紛。而若考慮對(duì)這些數(shù)據(jù)進(jìn)行脫敏,又面臨篩查識(shí)別準(zhǔn)確率方面的挑戰(zhàn)。兩難之下,合成數(shù)據(jù)就成為最惠而不費(fèi)的一種選擇。
此外,使用人類(lèi)數(shù)據(jù)進(jìn)行訓(xùn)練,還可能導(dǎo)致人工智能學(xué)到有害內(nèi)容。一些諸如使用日用品制造炸彈、管制化學(xué)品的方法,另一些則包括許多人工智能本不應(yīng)當(dāng)出現(xiàn)的壞習(xí)慣,譬如像人一樣在任務(wù)執(zhí)行過(guò)程中偷懶、為了取悅用戶(hù)而說(shuō)謊、產(chǎn)生偏見(jiàn)和歧視。若改用合成數(shù)據(jù),使人工智能在訓(xùn)練中盡可能減少接觸有害內(nèi)容,則有望克服以上使用人類(lèi)數(shù)據(jù)訓(xùn)練時(shí)附帶的缺點(diǎn)。
從以上分析中可以看出,合成數(shù)據(jù)可以說(shuō)是頗具開(kāi)創(chuàng)性的,有望解決此前發(fā)展人工智能與數(shù)據(jù)隱私保護(hù)不可得兼的問(wèn)題。但與此同時(shí),如何確保相關(guān)的公司和機(jī)構(gòu)負(fù)責(zé)任地制作合成數(shù)據(jù),如何制作出既符合本國(guó)文化與價(jià)值觀,又在規(guī)模和技術(shù)水平上足以媲美西方以英文網(wǎng)絡(luò)資料為中心的合成數(shù)據(jù)訓(xùn)練集,也將成為中國(guó)面臨的一個(gè)頗具挑戰(zhàn)性的課題。
除此之外,合成數(shù)據(jù)帶來(lái)的一個(gè)重大變化是,來(lái)自人類(lèi)社會(huì)的大數(shù)據(jù)或?qū)⒉辉偈茿I訓(xùn)練所必需。在今后的數(shù)字世界中,人類(lèi)數(shù)據(jù)的產(chǎn)生、存儲(chǔ)和使用仍將遵循人類(lèi)社會(huì)的法則和秩序,包括維護(hù)國(guó)家數(shù)據(jù)安全、保守商業(yè)數(shù)據(jù)秘密和尊重個(gè)人數(shù)據(jù)隱私,而AI訓(xùn)練所需的合成數(shù)據(jù)則采用另一套標(biāo)準(zhǔn)進(jìn)行管理。
以上便是此次帶來(lái)的人工智能相關(guān)內(nèi)容,通過(guò)本文,希望大家對(duì)人工智能已經(jīng)具備一定的了解。如果你喜歡本文,不妨持續(xù)關(guān)注我們網(wǎng)站哦,將于后期帶來(lái)更多精彩內(nèi)容。最后,十分感謝大家的閱讀,have a nice day!