當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 本文節(jié)選自《深度學(xué)習(xí)入門之PyTorch》,本書從人工智能的介紹入手,了解機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的基礎(chǔ)理論,并學(xué)習(xí)如何用PyTorch框架對(duì)模型進(jìn)行搭建。 對(duì)于人類而言,以前見過的事物會(huì)在腦

本文節(jié)選自《深度學(xué)習(xí)入門之PyTorch》,本書從人工智能的介紹入手,了解機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的基礎(chǔ)理論,并學(xué)習(xí)如何用PyTorch框架對(duì)模型進(jìn)行搭建。

對(duì)于人類而言,以前見過的事物會(huì)在腦海里面留下記憶,雖然隨后記憶會(huì)慢慢消失,但是每當(dāng)經(jīng)過提醒,人們往往能夠重拾記憶。在神經(jīng)網(wǎng)絡(luò)的研究中,讓模型充滿記憶力的研究很早便開始了,Saratha Sathasivam 于1982 年提出了霍普菲爾德網(wǎng)絡(luò),但是由于它實(shí)現(xiàn)困難,在提出的時(shí)候也沒有很好的應(yīng)用場景,所以逐漸被遺忘。深度學(xué)習(xí)的興起又讓人們重新開始研究循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network),并在序列問題和自然語言處理等領(lǐng)域取得很大的成功。

本文將從循環(huán)神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)出發(fā),介紹RNN在自然語言處理中的應(yīng)用及其PyTorch 實(shí)現(xiàn)。

循環(huán)神經(jīng)網(wǎng)絡(luò)

前一章介紹了卷積神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)相當(dāng)于人類的視覺,但是它并沒有記憶能力,所以它只能處理一種特定的視覺任務(wù),沒辦法根據(jù)以前的記憶來處理新的任務(wù)。那么記憶力對(duì)于網(wǎng)絡(luò)而言到底是不是必要的呢?很顯然在某些問題上是必要的,比如,在一場電影中推斷下一個(gè)時(shí)間點(diǎn)的場景,這個(gè)時(shí)候僅依賴于現(xiàn)在的情景并不夠,需要依賴于前面發(fā)生的情節(jié)。對(duì)于這樣一些不僅依賴于當(dāng)前情況,還依賴于過去情況的問題,傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)無法很好地處理,所以基于記憶的網(wǎng)絡(luò)模型是必不可少的。

循環(huán)神經(jīng)網(wǎng)絡(luò)的提出便是基于記憶模型的想法,期望網(wǎng)絡(luò)能夠記住前面出現(xiàn)的特征,并依據(jù)特征推斷后面的結(jié)果,而且整體的網(wǎng)絡(luò)結(jié)構(gòu)不斷循環(huán),因?yàn)榈妹h(huán)神經(jīng)
網(wǎng)絡(luò)。

循環(huán)神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)

循環(huán)神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)特別簡單,就是將網(wǎng)絡(luò)的輸出保存在一個(gè)記憶單元中,這個(gè)記憶單元和下一次的輸入一起進(jìn)入神經(jīng)網(wǎng)絡(luò)中。使用一個(gè)簡單的兩層網(wǎng)絡(luò)作為示范,在它的基礎(chǔ)上擴(kuò)充為循環(huán)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),我們用圖1簡單地表示。

可以看到網(wǎng)絡(luò)在輸入的時(shí)候會(huì)聯(lián)合記憶單元一起作為輸入,網(wǎng)絡(luò)不僅輸出結(jié)果,還會(huì)將結(jié)果保存到記憶單元中,圖1就是一個(gè)最簡單的循環(huán)神經(jīng)網(wǎng)絡(luò)在一次輸入時(shí)的結(jié)構(gòu)示意圖。

輸入序列的順序改變, 會(huì)改變網(wǎng)絡(luò)的輸出結(jié)果,這是因?yàn)橛洃泦卧拇嬖?,使得兩個(gè)序列在順序改變之后記憶單元中的元素也改變了,所以會(huì)影響最終的輸出結(jié)果。

 

圖1 將一個(gè)數(shù)據(jù)點(diǎn)傳入網(wǎng)絡(luò)

圖1是序列中一個(gè)數(shù)據(jù)點(diǎn)傳入網(wǎng)絡(luò)的示意圖,那么整個(gè)序列如何傳入網(wǎng)絡(luò)呢?將序列中的每個(gè)數(shù)據(jù)點(diǎn)依次傳入網(wǎng)絡(luò)即可,如圖2所示。

 

圖2 將整個(gè)序列傳入網(wǎng)絡(luò)

無論序列有多長,都能不斷輸入網(wǎng)絡(luò),最終得到結(jié)果。可能看到這里,讀者會(huì)有一些疑問,圖2中每一個(gè)網(wǎng)絡(luò)是不是都是獨(dú)立的權(quán)重?對(duì)于這個(gè)問題,先考慮一下如果是不同的序列,那么圖2 中格子的數(shù)目就是不同的,對(duì)于一個(gè)網(wǎng)絡(luò)結(jié)構(gòu),不太可能出現(xiàn)這種參數(shù)數(shù)目變化的情況。

事實(shí)上,這里再次使用了參數(shù)共享的概念,也就是說雖然上面有三個(gè)格子,其實(shí)它們都是同一個(gè)格子,而網(wǎng)絡(luò)的輸出依賴于輸入和記憶單元,可以用圖5.5表示。

如圖5.5所示,左邊就是循環(huán)神經(jīng)網(wǎng)絡(luò)實(shí)際的網(wǎng)絡(luò)流,右邊是將其展開的結(jié)果,可以看到網(wǎng)絡(luò)中具有循環(huán)結(jié)構(gòu),這也是循環(huán)神經(jīng)網(wǎng)絡(luò)名字的由來。同時(shí)根據(jù)循環(huán)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)也可以看出它在處理序列類型的數(shù)據(jù)上具有天然的優(yōu)勢,因?yàn)榫W(wǎng)絡(luò)本身就是一個(gè)序列結(jié)構(gòu),這也是所有循環(huán)神經(jīng)網(wǎng)絡(luò)最本質(zhì)的結(jié)構(gòu)。

 

圖3 網(wǎng)絡(luò)的輸入和記憶單元

循環(huán)神經(jīng)網(wǎng)絡(luò)也可以有很深的網(wǎng)絡(luò)層結(jié)構(gòu),如圖4所示。

 

圖4 深層網(wǎng)絡(luò)結(jié)構(gòu)

可以看到網(wǎng)絡(luò)是單方向的,這代表網(wǎng)絡(luò)只能知道單側(cè)的信息,有的時(shí)候序列的信息不只是單邊有用,雙邊的信息對(duì)預(yù)測結(jié)果也很重要,比如語音信號(hào),這時(shí)候就需要看到兩側(cè)信息的循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。這并不需要用兩個(gè)循環(huán)神經(jīng)網(wǎng)絡(luò)分別從左右兩邊開始讀取序列輸入,使用一個(gè)雙向的循環(huán)神經(jīng)網(wǎng)絡(luò)就能完成這個(gè)任務(wù),如圖5所示。

 

圖5 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉