人工智能的升級(jí)會(huì)導(dǎo)致部分人類失業(yè)嗎
掃描二維碼
隨時(shí)隨地手機(jī)看文章
最近幾個(gè)月很多人都看到了現(xiàn)在有很多方法解決人工智能“大數(shù)據(jù)問題”從而帶給人工智能巨大推動(dòng)力,并且已經(jīng)開始出現(xiàn)一些有趣的突破,可以讓更多的公司和組織使用AI。
什么是大數(shù)據(jù)問題?通過獲取足夠多的數(shù)據(jù)來訓(xùn)練算法模型從而實(shí)現(xiàn)人工智能,目前來說這是最主流的開發(fā)AI技術(shù)的方式,它允許機(jī)器自己找到數(shù)據(jù)中的關(guān)系和模式。例如,在算法模型獲取過許多貓的圖像后,深度學(xué)習(xí)程序可以創(chuàng)建自己對(duì)“貓”構(gòu)成的定義,并使用它來識(shí)別未來的圖像為“貓”或“不是貓”。
深度學(xué)習(xí)算法通常需要數(shù)百萬(wàn)個(gè)訓(xùn)練樣例才能完整的訓(xùn)練出可用的算法模型。但是,許多公司和組織無法訪問或者擁有如此大型的帶注釋數(shù)據(jù)的緩存來訓(xùn)練他們的模型,獲取數(shù)百萬(wàn)張貓的圖片已經(jīng)足夠困難;如何獲得數(shù)百萬(wàn)個(gè)正確注釋的客戶資料、或者考慮來自醫(yī)療保健領(lǐng)域,數(shù)以百萬(wàn)計(jì)的注釋過的醫(yī)學(xué)影像數(shù)據(jù)呢。最重要的是,在許多領(lǐng)域,數(shù)據(jù)分散,需要付出巨大的努力和資金來鞏固和清理人工智能的數(shù)據(jù)。在其他領(lǐng)域,數(shù)據(jù)受隱私法和其他法規(guī)的約束,這可能使數(shù)據(jù)甚至無法傳播出來。
這就是為什么人工智能研究人員在過去幾年里一直面臨著為深度學(xué)習(xí)的巨大數(shù)據(jù)需求找到變通方法的原因。這就是為什么最近幾個(gè)月出現(xiàn)了很多有趣的解決方法。
在人工智能六十年歷史的很大一部分中,該領(lǐng)域的特點(diǎn)是象征性和聯(lián)結(jié)性人工智能之間的競(jìng)爭(zhēng)。象征主義者認(rèn)為AI必須基于程序員編寫的明確規(guī)則。連接主義者認(rèn)為AI必須通過經(jīng)驗(yàn)學(xué)習(xí),這種方法在深度學(xué)習(xí)中使用。但最近,研究人員發(fā)現(xiàn),通過結(jié)合連接主義和符號(hào)模型,他們可以創(chuàng)建一個(gè)需要極少的訓(xùn)練數(shù)據(jù)就可完成的AI系統(tǒng)。
在5月來自麻省理工學(xué)院和IBM的研究人員介紹了“神經(jīng)符號(hào)概念學(xué)習(xí)者”,這是一種將基于規(guī)則的AI和神經(jīng)網(wǎng)絡(luò)結(jié)合在一起的AI模型。使用神經(jīng)網(wǎng)絡(luò)從圖像中提取特征并組成一個(gè)結(jié)構(gòu)化的信息表。然后,它使用經(jīng)典的基于規(guī)則的程序來處理問題并根據(jù)這些符號(hào)解決問題。通過結(jié)合神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力和基于規(guī)則的AI的推理能力,可以用更少的數(shù)據(jù)適應(yīng)新的設(shè)置和問題。研究人員測(cè)試了AI模型,這是一個(gè)圖像識(shí)別的測(cè)試。在測(cè)試中,算法模型必須回答有關(guān)給定圖片中包含的對(duì)象和元素的問題。純粹基于神經(jīng)網(wǎng)絡(luò)的AI模型通常需要大量的訓(xùn)練樣例來解決圖像識(shí)別問題的準(zhǔn)確性。但是,現(xiàn)在這種結(jié)合的方式能夠用一小部分?jǐn)?shù)據(jù)來掌握所有圖像的規(guī)律從而進(jìn)行新的圖像識(shí)別。
減少訓(xùn)練數(shù)據(jù)的傳統(tǒng)方法是使用轉(zhuǎn)移學(xué)習(xí),采用預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)的過程并對(duì)其進(jìn)行微調(diào)以完成新任務(wù)。例如,一種在數(shù)百萬(wàn)圖像上訓(xùn)練的開源圖像分類器,并通過使用特定于域的示例對(duì)其進(jìn)行重新訓(xùn)練,將其重新用于新任務(wù)。轉(zhuǎn)移學(xué)習(xí)減少了創(chuàng)建AI模型所需的培訓(xùn)數(shù)據(jù)量。但它可能仍需要數(shù)百個(gè)示例,調(diào)整過程需要大量的試驗(yàn)和錯(cuò)誤。
最近幾個(gè)月,人工智能研究人員已經(jīng)能夠創(chuàng)造出能夠用更少的例子訓(xùn)練新任務(wù)的技術(shù)。今年5月,三星的研究實(shí)驗(yàn)室推出了Talking Heads,這是一款可以進(jìn)行少數(shù)鏡頭學(xué)習(xí)的面部動(dòng)畫AI模型。Talking Heads系統(tǒng)可以通過僅查看主體的幾張圖像來模擬以前看不見的人的肖像。在對(duì)面部的大型數(shù)據(jù)集進(jìn)行訓(xùn)練之后,AI學(xué)習(xí)從新圖像中識(shí)別和提取面部地標(biāo),并以自然方式操縱它們,而無需許多示例。
為了解決這個(gè)問題,許多研究人員正在從生成對(duì)抗網(wǎng)絡(luò)(GAN)獲得幫助,在2014年發(fā)明的一種技術(shù).對(duì)抗網(wǎng)絡(luò)將生成器和鑒別器神經(jīng)網(wǎng)絡(luò)相互對(duì)接以創(chuàng)建新數(shù)據(jù)。 對(duì)抗網(wǎng)絡(luò)還可以幫助減少收集數(shù)據(jù)的的人力。國(guó)立臺(tái)灣大學(xué)的研究人員最近創(chuàng)建了一個(gè)對(duì)抗網(wǎng)絡(luò),可以生成電子健康記錄來訓(xùn)練AI模型。由于生成的EHR純粹是合成的,因此使用它們來訓(xùn)練模型的AI工程師無需獲得特殊許可。最近,德國(guó)呂貝克大學(xué)的研究人員介紹了一種使用對(duì)抗網(wǎng)絡(luò)合成高質(zhì)量醫(yī)學(xué)圖像如CT掃描和MRI的新方法。這種新技術(shù)具有更高的效率和低消耗的優(yōu)點(diǎn),這意味著它不需要大型AI實(shí)驗(yàn)室和大型科技公司可用的龐大計(jì)算資源。
許多人擔(dān)心隨著深度學(xué)習(xí)的興起,能夠訪問大量數(shù)據(jù)的公司和組織將占據(jù)主導(dǎo)地位。雖然很難預(yù)測(cè)數(shù)據(jù)密集程度較低的AI模型需要多長(zhǎng)時(shí)間才能從研究實(shí)驗(yàn)室轉(zhuǎn)向商用選項(xiàng),但可以肯定的是,隨著這些和其他類似項(xiàng)目的出現(xiàn),我們可以更加充滿希望深度學(xué)習(xí)創(chuàng)新不僅限于現(xiàn)有的IT巨頭公司。