谷歌和一眾海洋鯨類(lèi)專家對(duì)多年的海底錄音進(jìn)行了人工智能研究,希望建立一個(gè)能夠識(shí)別座頭鯨叫聲的機(jī)器學(xué)習(xí)模型。這是該公司新推出的“面向社會(huì)公益的人工智能”(AI for social good)計(jì)劃的一部分,該計(jì)劃顯然旨在反駁人工智能主要用于面部識(shí)別和廣告定位的說(shuō)法。
鯨魚(yú)旅行相當(dāng)多,因?yàn)樗麄儗ふ腋玫囊捠硤?chǎng)所,溫暖的水域和社交聚會(huì)。但很自然地,這些運(yùn)動(dòng)是很難追蹤的。幸運(yùn)的是,鯨魚(yú)互相呼叫,以各自可識(shí)別的方式唱歌,這些歌曲可以在水下長(zhǎng)距離傳播。
因此,在海底安裝了一個(gè)全球范圍內(nèi)的監(jiān)聽(tīng)設(shè)備網(wǎng)絡(luò),你就可以追蹤鯨魚(yú)的活動(dòng)——如果你想要監(jiān)聽(tīng)多年的背景噪音,并手動(dòng)識(shí)別這些聲音,那就是。這就是我們這么做了很長(zhǎng)一段時(shí)間,雖然電腦幫助減輕了負(fù)擔(dān)。谷歌的團(tuán)隊(duì)與美國(guó)國(guó)家海洋和大氣管理局合作,認(rèn)為這是一個(gè)很好的機(jī)器學(xué)習(xí)系統(tǒng)人才的匹配。
這些人工智能模型非常善于從大量的噪聲數(shù)據(jù)中尋找特定的模式,這就是為什么它們被應(yīng)用到像射電望遠(yuǎn)鏡和閉路電視攝像機(jī)那樣的海量數(shù)據(jù)中。
在這個(gè)案例中,數(shù)據(jù)是來(lái)自太平洋各地的十幾個(gè)水聽(tīng)器多年的記錄。這個(gè)數(shù)據(jù)集已經(jīng)很大程度上被調(diào)查,但谷歌研究人員想知道人工智能代理能做的做第一遍的艱苦和耗時(shí)的工作,標(biāo)志著一段有趣的聲音與一個(gè)物種的名字。
有趣的是,但回顧起來(lái)并不奇怪,音頻沒(méi)有這樣分析;相反的是,音頻被轉(zhuǎn)換成圖像,它可以尋找模式。這些聲譜圖記錄了聲音在一定頻率范圍內(nèi)隨時(shí)間的強(qiáng)度,可以用于各種有趣的事情。碰巧的是,機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺(jué)研究人員也對(duì)它們進(jìn)行了很好的研究,他們開(kāi)發(fā)了各種有效分析它們的方法。
機(jī)器學(xué)習(xí)模型提供了座頭鯨叫聲的例子,并學(xué)會(huì)了如何在一組樣本數(shù)據(jù)中合理準(zhǔn)確地識(shí)別它們。進(jìn)行了各種各樣的實(shí)驗(yàn),以確定哪些設(shè)置是最優(yōu)的——例如,哪些剪輯長(zhǎng)度易于處理且不會(huì)過(guò)長(zhǎng),或者哪些頻率可以安全地忽略。最后的研究將多年的數(shù)據(jù)分為75秒的片段,模型能夠以90%的準(zhǔn)確率確定一個(gè)片段是否包含“座頭鯨單元”,或者相關(guān)的鯨魚(yú)聲音。
第二項(xiàng)研究依賴于所謂的“無(wú)監(jiān)督學(xué)習(xí)”(unsupervised learning),該系統(tǒng)在某種程度上對(duì)鯨的聲音和非鯨的聲音之間的相似性建立自己的規(guī)則,從而形成一個(gè)研究人員可以梳理和找到相關(guān)群體的情節(jié)。
它使可視化變得更加有趣,但卻更難解釋,而且無(wú)論如何,它似乎并沒(méi)有帶來(lái)一套更傳統(tǒng)的分類(lèi)方法那么有用。
就像機(jī)器學(xué)習(xí)在各種學(xué)術(shù)領(lǐng)域的類(lèi)似應(yīng)用一樣,這不會(huì)取代仔細(xì)觀察和文檔,而會(huì)增加它們。把一些繁重的科學(xué)工作從科學(xué)中剝離出來(lái),讓研究人員專注于他們的專業(yè),而不是陷入重復(fù)的統(tǒng)計(jì)數(shù)據(jù)和長(zhǎng)達(dá)數(shù)小時(shí)的數(shù)據(jù)分析會(huì)議中。