利用光信息實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)計(jì)算是怎么一回事
美國加州大學(xué)洛杉磯分校的科學(xué)家利用光信息實(shí)現(xiàn)了神經(jīng)網(wǎng)絡(luò)計(jì)算,相較傳統(tǒng)電子器件,其處理速度接近光速,但準(zhǔn)確性有所降低。
神經(jīng)網(wǎng)絡(luò)以計(jì)算成本昂貴而著稱。但只有訓(xùn)練部分才會對大多數(shù)計(jì)算機(jī)硬件造成壓力,因?yàn)樗婕皩π阅艿亩ㄆ谠u估和不斷往返于內(nèi)存來調(diào)整其與人工神經(jīng)元之間的連接。相比之下,使用訓(xùn)練過的神經(jīng)網(wǎng)絡(luò)是一個簡單得多的過程,計(jì)算上并不復(fù)雜。事實(shí)上,可以在完全不同的硬件上運(yùn)行訓(xùn)練和執(zhí)行階段。
而且在這兩種過程中,硬件方面似乎有相當(dāng)大的靈活性。例如,可以使用一種名為“memristor”的特殊內(nèi)存來訓(xùn)練神經(jīng)網(wǎng)絡(luò),或者使用定制的硅芯片來執(zhí)行訓(xùn)練過的神經(jīng)網(wǎng)絡(luò)?,F(xiàn)在,加州大學(xué)洛杉磯分校的研究人員完成了一項(xiàng)更激進(jìn)的研究。在用傳統(tǒng)的計(jì)算硬件訓(xùn)練了神經(jīng)網(wǎng)絡(luò)之后,他們3D打印出一組面板來操縱光,其操縱效果等同于使用神經(jīng)網(wǎng)絡(luò)來處理信息。最后,研究人員以光速實(shí)現(xiàn)了神經(jīng)網(wǎng)絡(luò)計(jì)算,盡管計(jì)算精度與傳統(tǒng)硬件相比有所降低。
那么如何使用光來實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)?要理解這一點(diǎn),必須了解深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。在每一層神經(jīng)網(wǎng)絡(luò)中,來自上一層神經(jīng)網(wǎng)絡(luò)的信號(或來自源輸入)由“神經(jīng)元”處理,然后接收結(jié)果并將正向信號轉(zhuǎn)發(fā)給下一層的神經(jīng)元。它們發(fā)送給神經(jīng)元以及它們傳遞的信號有多強(qiáng)取決于它們所接受的訓(xùn)練。
為了利用光,加州大學(xué)洛杉磯分校團(tuán)隊(duì)創(chuàng)造了一種半透明的、可折射的面板。當(dāng)光射向它時,面板的精細(xì)結(jié)構(gòu)決定了光穿過的距離和方向。如果在第一層面板后面放置另一層相同的面板,它將繼續(xù)把光重定向到特定的位置。這在原則上與深度學(xué)習(xí)網(wǎng)絡(luò)的工作方式相似,即網(wǎng)絡(luò)的每一層都將信號重定向到下一層的特定位置。
實(shí)際上,研究人員訓(xùn)練了一個神經(jīng)網(wǎng)絡(luò),識別出它與下層之間的聯(lián)系,然后將這些聯(lián)系轉(zhuǎn)化為面板的結(jié)構(gòu)特征,并以類似的方式引導(dǎo)光。通過打印一系列的面板,光會逐漸集中在一個特定區(qū)域。通過在最后一層面板后面的特定位置放置探測器,他們就能知道光的最終去向。而且,如果一切都得到恰當(dāng)處理,光的終點(diǎn)就能代表神經(jīng)網(wǎng)絡(luò)的處理結(jié)果。
研究人員嘗試了兩種不同類型的圖像識別任務(wù)。首先,他們訓(xùn)練神經(jīng)網(wǎng)絡(luò)來識別手寫數(shù)字,然后他們翻譯并打印出適合10個光電探測器的網(wǎng)格來記錄輸出。這是通過一個五層神經(jīng)網(wǎng)絡(luò)完成的,研究人員及時打印出五層光控制材料。為了給神經(jīng)網(wǎng)絡(luò)提供輸入,他們還打印了一張表格,讓他們將被識別的對象投影到神經(jīng)網(wǎng)絡(luò)的第一層。
當(dāng)加州大學(xué)洛杉磯分校的研究人員用手寫數(shù)字做這個實(shí)驗(yàn)時,他們遇到了一個問題:許多數(shù)字(如0和9)的開放區(qū)域被書寫的數(shù)字部分所包圍。為了讓3D打印出能投射數(shù)字形狀的掩模,必須將它轉(zhuǎn)換成用一個由開放空間包圍的填充區(qū)域的底片。這對于3D打印是相當(dāng)困難的,因?yàn)橹辽夙毷褂靡恍┎牧蟻肀3痔钊氲膮^(qū)域與屏幕的其他部分相連。他們懷疑,這降低了識別任務(wù)的準(zhǔn)確性。不過,他們的準(zhǔn)確率還是達(dá)到了90%以上。
他們在對衣物進(jìn)行類似測試時甚至做得更好。雖然總準(zhǔn)確率只有86%,但在運(yùn)行神經(jīng)網(wǎng)絡(luò)軟件與在光線下運(yùn)行神經(jīng)網(wǎng)絡(luò)的區(qū)別較小。研究人員推測,性能上的差異主要?dú)w結(jié)于這樣一個事實(shí),即完整的性能要求神經(jīng)網(wǎng)絡(luò)的所有層之間進(jìn)行極其精確的對齊,而當(dāng)這些層是小的物理層時,則很難排列。這也可以解釋為什么在基于光的神經(jīng)網(wǎng)絡(luò)中添加更多的層對準(zhǔn)確度稍有影響。
總的來說,這項(xiàng)工作非常令人印象深刻。雖然性能低于基于計(jì)算機(jī)的方法,但研究人員推測,至少有些問題是可以通過開發(fā)更好的系統(tǒng)來調(diào)整構(gòu)成網(wǎng)絡(luò)不同層的工作層進(jìn)行對齊,盡管這個挑戰(zhàn)會隨著神經(jīng)網(wǎng)絡(luò)中層數(shù)的增加而加大??蒲腥藛T認(rèn)為它可能在實(shí)踐中有用,他們強(qiáng)調(diào),使用光計(jì)算的速度非???,而且大多數(shù)光源的功率都非常低。
但確實(shí)存在一些實(shí)際障礙。這種材料只適用于單一波長的光,這意味著不能僅僅把任何東西放到系統(tǒng)就期望它能工作。目前,這由投影系統(tǒng)來保證,但是這依賴于3D打印一張紙來投影特定形狀,這并不是一個高效的過程。用一種單色投影儀系統(tǒng)來代替是可能的,但不清楚分辨率對系統(tǒng)精度的影響有多大。所以在知道這類系統(tǒng)是否有實(shí)際應(yīng)用之前還有一些工作要做。