人工智能全新突破:神經(jīng)網(wǎng)絡(luò)可自主識(shí)別圖片中的對(duì)象
據(jù)外媒報(bào)道,利用神經(jīng)生物學(xué)方法,芬蘭計(jì)算機(jī)科學(xué)家正在人工智能研究的過程中取得新突破:深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)可以自主識(shí)別出圖片中的對(duì)象,準(zhǔn)確率達(dá)到了75%。
人腦非常奇妙。在幾十年研究之后,人類仍然無(wú)法復(fù)制出人腦的超快計(jì)算速度。目前,計(jì)算機(jī)科學(xué)家可以利用的最強(qiáng)大工具是神經(jīng)網(wǎng)絡(luò)。這樣的大型計(jì)算機(jī)網(wǎng)絡(luò)能通過訓(xùn)練去解決復(fù)雜問題,而機(jī)制類似于人類的中樞神經(jīng)系統(tǒng),即利用不同層次的神經(jīng)元解決問題的不同部分,最終合并為適當(dāng)?shù)拇鸢浮?/p>
目前的問題在于,這樣的神經(jīng)網(wǎng)絡(luò)需要大量數(shù)據(jù)輸入和訓(xùn)練,隨后才能學(xué)會(huì)如何解決問題。例如,ImageNet是個(gè)很好的訓(xùn)練數(shù)據(jù)源,這一龐大的可視化信息數(shù)據(jù)庫(kù)中包含100萬(wàn)張經(jīng)過人工標(biāo)注的照片。
這被稱作“監(jiān)督學(xué)習(xí)”,而真正的人工智能意味著,神經(jīng)網(wǎng)絡(luò)需要學(xué)會(huì)如何自動(dòng)完成“無(wú)監(jiān)督學(xué)習(xí)”。這正是芬蘭創(chuàng)業(yè)公司Curious AI希望實(shí)現(xiàn)的目標(biāo)。
Curious AI首席技術(shù)官安迪·拉斯姆斯(AntTI Rasmus)在赫爾辛基的Slush 2016科技行業(yè)大會(huì)上表示:“人腦會(huì)進(jìn)行大量的無(wú)監(jiān)督學(xué)習(xí)。我們不需要反復(fù)告訴嬰兒,勺子是什么。他們可以自動(dòng)從環(huán)境中學(xué)習(xí),并形成概念。”
“對(duì)人腦來(lái)說,根據(jù)某一對(duì)象形成概念很簡(jiǎn)單。這已在心理學(xué)中得到了研究,即‘格式塔理論’。人腦會(huì)將具備類似形狀、顏色、運(yùn)動(dòng)狀態(tài)和模式的東西歸類在一起。我們采取的第一步是讓深度學(xué)習(xí)系統(tǒng)能像人腦一樣,對(duì)對(duì)象進(jìn)行歸類。”
將神經(jīng)科學(xué)應(yīng)用于人工神經(jīng)網(wǎng)絡(luò)在神經(jīng)科學(xué)中,名為“速率編碼”的理論認(rèn)為,大腦中神經(jīng)元的激發(fā)速率越高,神經(jīng)元就越活躍。神經(jīng)元持續(xù)被激發(fā)。而80年代時(shí),科學(xué)家發(fā)現(xiàn),神經(jīng)元會(huì)將自身組織在一起,代表不同的信息。
這一理論被稱作“臨時(shí)編碼”。理論認(rèn)為,神經(jīng)元的激發(fā)時(shí)機(jī)很重要,而準(zhǔn)確的激發(fā)時(shí)機(jī)定義了,在數(shù)萬(wàn)神經(jīng)元中哪些神經(jīng)元屬于同一群體。因此,一部分神經(jīng)元可以同時(shí)激發(fā),幫助大腦識(shí)別一系列對(duì)象中的某個(gè)對(duì)象,例如一堆辦公用品中的一塊紅布,而另一部分神經(jīng)元會(huì)告知大腦,其他對(duì)象都屬于背景信息。
拉斯姆斯表示:“我們的計(jì)算機(jī)算法集成了臨時(shí)編碼機(jī)制。我們?cè)谏窠?jīng)網(wǎng)絡(luò)的每層中保存多個(gè)拷貝。整個(gè)神經(jīng)網(wǎng)絡(luò)被復(fù)制了4次。這意味著系統(tǒng)可以學(xué)習(xí)得知,每個(gè)拷貝代表了某個(gè)特定對(duì)象,而將這些對(duì)象合并在一起,就可以與原始圖像進(jìn)行匹配。”拉斯姆斯此前曾是英偉達(dá)的軟件工程師,目前正在芬蘭阿爾托大學(xué)從事深度學(xué)習(xí)的博士研究工作。
“通過將圖像分為不同的4組,神經(jīng)網(wǎng)絡(luò)可以自行編碼圖像。這就是無(wú)監(jiān)督學(xué)習(xí),我們不用對(duì)系統(tǒng)進(jìn)行任何標(biāo)記。當(dāng)我們向神經(jīng)網(wǎng)絡(luò)展示圖片時(shí),它會(huì)將圖片自主分解成為元素(例如圖片中的對(duì)象)。”
在神經(jīng)網(wǎng)絡(luò)將圖片分解為單獨(dú)元素之后,歸類和識(shí)別對(duì)象就變得更容易,因?yàn)檫@些對(duì)象不會(huì)相互重疊,導(dǎo)致圖像模糊不清。
知覺分組可以給深度學(xué)習(xí)帶來(lái)變革研究人員最初指導(dǎo)神經(jīng)網(wǎng)絡(luò)在無(wú)監(jiān)督的情況下分析圖片,組織對(duì)象,隨后向圖像加入標(biāo)記信息(監(jiān)督學(xué)習(xí)),從而觀察系統(tǒng)究竟學(xué)會(huì)了什么。他們發(fā)現(xiàn),Curious AI的Tagger系統(tǒng)能實(shí)現(xiàn)75.1%的準(zhǔn)確率。
作為對(duì)比,傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確率只有21%,比隨機(jī)猜測(cè)的準(zhǔn)確率僅僅高出1%。
拉斯姆斯表示:“這是革命性的研究,這使得無(wú)監(jiān)督學(xué)習(xí)獲得了進(jìn)一步發(fā)展。通過讓機(jī)器獲得對(duì)象的概念,我們實(shí)現(xiàn)了更類似人腦的無(wú)監(jiān)督學(xué)習(xí)。這可以幫助未來(lái)的研究,讓神經(jīng)網(wǎng)絡(luò)進(jìn)行更高層次的推理,學(xué)習(xí)對(duì)象與環(huán)境的相關(guān)性。”
“在當(dāng)前系統(tǒng)中,計(jì)算機(jī)運(yùn)行在基于統(tǒng)計(jì)的世界觀中。如果讓計(jì)算機(jī)進(jìn)入人類生活的世界,那么非常重要的一點(diǎn)是讓機(jī)器以類似人類的方式去理解世界。人們通常很難理解計(jì)算機(jī)視覺的效果很差,因?yàn)槿搜垡曈X對(duì)我們來(lái)說很自然。”
該公司的相應(yīng)論文《Tagger:深度無(wú)監(jiān)督知覺分組》將于12月7日在巴塞羅那的“神經(jīng)信息處理系統(tǒng)2016”深度學(xué)習(xí)大會(huì)上發(fā)表。
Curious AI正在尋找工業(yè)界的合作伙伴,在現(xiàn)實(shí)世界的人工智能系統(tǒng)中試點(diǎn)其深度學(xué)習(xí)技術(shù)。目前,該公司正與希望發(fā)展無(wú)人駕駛技術(shù)的汽車廠商進(jìn)行接觸。