如何利用深度學(xué)習(xí)識(shí)別千萬(wàn)張圖片
掃描二維碼
隨時(shí)隨地手機(jī)看文章
首先我們來(lái)談一下什么是卷積神經(jīng)網(wǎng)絡(luò),相信在深度學(xué)習(xí)中這是最重要的概念,首先你可以把卷積想象成一種混合信息的手段。想象一下裝滿信息的兩個(gè)桶,我們把它們倒入一個(gè)桶中并且通過(guò)某種規(guī)則攪拌攪拌。也就是說(shuō)卷積是一種混合兩種信息的流程。
卷積神經(jīng)網(wǎng)絡(luò)是一個(gè)多層的神經(jīng)網(wǎng)絡(luò),每層由多個(gè)二維平面組成,而每個(gè)平面由多個(gè)獨(dú)立神經(jīng)元組成。如下圖所示,當(dāng)我們?cè)趫D像上應(yīng)用卷積時(shí),我們?cè)趦蓚€(gè)維度上執(zhí)行卷積——水平和豎直方向。我們混合兩桶信息:第一桶是輸入的圖像,由三個(gè)矩陣構(gòu)成—— RGB 三通道,其中每個(gè)元素都是 0 到 255 之間的一個(gè)整數(shù)。第二個(gè)桶是卷積核(kernel),單個(gè)浮點(diǎn)數(shù)矩陣??梢詫⒕矸e核的大小和模式想象成一個(gè)攪拌圖像的方法。卷積核的輸出是一幅修改后的圖像,在深度學(xué)習(xí)中經(jīng)常被稱作 feature map。對(duì)每個(gè)顏色通道都有一個(gè) feature map。
談到這里,就不得不說(shuō)一下卷積定理,它將時(shí)域和空域上的復(fù)雜卷積對(duì)應(yīng)到了頻域中的元素間簡(jiǎn)單的乘積。這個(gè)定理可以說(shuō)是及其強(qiáng)悍,在包括圖像處理等許多科學(xué)領(lǐng)域中得到了廣泛應(yīng)用。
什么,你說(shuō)上面的公式你看不懂,那么小編在此解釋以下,第一個(gè)等式是一維連續(xù)域上兩個(gè)連續(xù)函數(shù)的卷積;第二個(gè)等式是二維離散域(圖像)上的卷積。這里的“離散”指的是數(shù)據(jù)由有限個(gè)變量構(gòu)成(像素);一維指的是數(shù)據(jù)是一維的(時(shí)間),圖像則是二維的,視頻則是三維的。當(dāng)然在實(shí)際工作中,我們根部不需要理解上面的公式是什么意思,畢竟沒(méi)有什么問(wèn)題是調(diào)包解決不了的,如果有那就再調(diào)一次包(手動(dòng)滑稽)。
在圖像識(shí)別問(wèn)題中,輸入層的每一個(gè)神經(jīng)元可能代表一個(gè)像素的灰度值。但這種神經(jīng)網(wǎng)絡(luò)用于圖像識(shí)別有幾個(gè)問(wèn)題,一是沒(méi)有考慮圖像的空間結(jié)構(gòu),識(shí)別性能會(huì)受到限制;二是每相鄰兩層的神經(jīng)元都是全相連,參數(shù)太多,訓(xùn)練速度受到限制。而卷積神經(jīng)網(wǎng)絡(luò)就可以解決這些問(wèn)題。卷積神經(jīng)網(wǎng)絡(luò)使用了針對(duì)圖像識(shí)別的特殊結(jié)構(gòu),可以快速訓(xùn)練。因?yàn)樗俣瓤?,使得采用多層神?jīng)網(wǎng)絡(luò)變得容易,而多層結(jié)構(gòu)在識(shí)別準(zhǔn)確率上又很大優(yōu)勢(shì)。
還有一個(gè)問(wèn)題等待我們解決,就是卷積神經(jīng)網(wǎng)絡(luò)(CNN)如何提高圖片的識(shí)別精度呢?問(wèn)題的關(guān)鍵在要在以上的基礎(chǔ)上再加上池化層和卷積層。和一個(gè)額外全連接層的結(jié)構(gòu),其實(shí)我們可以這么理解,卷積層和池化層學(xué)習(xí)輸入圖像中的局部空間結(jié)構(gòu),而后面的全連接層的作用是在一個(gè)更加抽象的層次上學(xué)習(xí),包含了整個(gè)圖像中的更多的全局的信息。
以上,基本就是卷積神經(jīng)網(wǎng)絡(luò)在圖像處理中的應(yīng)用,我們可以看到在用 CNN 處理圖片中,涉及很多知識(shí)點(diǎn)和工具。圖像處理這個(gè)領(lǐng)域?qū)W習(xí)成本相對(duì)較高,如果一個(gè)新人沒(méi)人人引領(lǐng)入門(mén)往往不得其門(mén)而入,這樣會(huì)浪費(fèi)大量的時(shí)間,為此,AICon 全球人工智能與機(jī)器學(xué)習(xí)技術(shù)大會(huì)特意邀請(qǐng)到了曠世 face++ 科技的高級(jí)研究員熊鵬飛老師,為大家深入淺出的講解深度學(xué)習(xí)在圖像處理中的應(yīng)用。感興趣的小伙伴們掃描下面圖片中的二維碼了解詳細(xì)情況。