在20世紀(jì)20年代初,當(dāng)復(fù)雜的消費(fèi)者神經(jīng)網(wǎng)絡(luò)首次出現(xiàn)時,這些觀點(diǎn)還能站得住腳。那時候,如果你想自動識別小貓,你確實(shí)需要谷歌“吞噬世界”的服務(wù)器的力量。
當(dāng)然,這也會產(chǎn)生隱私泄露的風(fēng)險,想想亞馬遜或谷歌的轉(zhuǎn)包商坐在一旁聽我們家里傳送過來的音頻片段,或者黑客遠(yuǎn)程監(jiān)視我們的孩子,這有多恐怖。
這個問題是結(jié)構(gòu)性的。它融入了當(dāng)今消費(fèi)類人工智能的構(gòu)建和部署方式。大型科技公司都是在這樣的假設(shè)下運(yùn)作的:人工智能要想最有效地識別人臉和聲音等,就需要深入學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),而這需要強(qiáng)大的計(jì)算能力。我們被告知,這些神經(jīng)網(wǎng)絡(luò)需要大量的數(shù)據(jù),需要源源不斷地輸入數(shù)據(jù)來提高它們的智能水平,所以它必須在云端發(fā)生,對嗎?
但摩爾定律就是摩爾定律,近年來人工智能硬件和軟件都有了巨大的改進(jìn)。如今,有了一種新的神經(jīng)網(wǎng)絡(luò),它可以完全運(yùn)行在廉價、低功耗的微處理器上,它可以完成我們需要的所有人工智能技巧,但永遠(yuǎn)不會將圖片或聲音發(fā)送到云端,它就是邊緣AI。在接下來的一段時間里,如果我們足夠幸運(yùn)的話,我相信它可以給我們帶來方便,而且不會損害我們的隱私。
一家邊緣AI公司——Picovoice,它生產(chǎn)的軟件可以識別語音命令,但你能想象,它只是運(yùn)行在一個價格不超過幾美元的小微處理器上嗎?硬件是如此便宜,以至于智能語音技術(shù)可能會被應(yīng)用于洗衣機(jī)或洗碗機(jī)等日常家居中。Picovoice表示,它已經(jīng)在與各大家電公司合作開發(fā)語音控制設(shè)備。
這么小的AI是怎么運(yùn)行的?
這其實(shí)是一個巧妙的工程技術(shù)。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)多使用長數(shù)位數(shù)的數(shù)字進(jìn)行計(jì)算,而Picovoice使用的是非常短的數(shù)字,甚至二進(jìn)制的1和0,這就使得AI可以在速度慢得多的芯片上運(yùn)行。這種折中方案塑造出來的似乎是一個不那么雄心勃勃的機(jī)器人:一個咖啡機(jī)的語音識別人工智能只需要識別大約200個單詞,所有這些都與java的釀造任務(wù)有關(guān)。