神經(jīng)網(wǎng)絡(luò)是一種系統(tǒng),或者說是神經(jīng)元的結(jié)構(gòu),它使人工智能能夠更好地理解數(shù)據(jù),從而解決復(fù)雜的問題。雖然網(wǎng)絡(luò)類型多種多樣,但本系列文章將僅關(guān)注卷積神經(jīng)網(wǎng)絡(luò) (CNN)。CNN 的主要應(yīng)用領(lǐng)域是模式識(shí)別和對(duì)輸入數(shù)據(jù)中包含的對(duì)象進(jìn)行分類。CNN 是一種用于深度學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò)。這種網(wǎng)絡(luò)由一個(gè)輸入層、幾個(gè)卷積層和一個(gè)輸出層組成。卷積層是最重要的組件,因?yàn)樗鼈兪褂靡唤M獨(dú)特的權(quán)重和過濾器,使網(wǎng)絡(luò)能夠從輸入數(shù)據(jù)中提取特征。數(shù)據(jù)可以有多種不同的形式,例如圖像、音頻和文本。這種特征提取過程使 CNN 能夠識(shí)別數(shù)據(jù)中的模式。通過從數(shù)據(jù)中提取特征,CNN 使工程師能夠創(chuàng)建更有效、更高效的應(yīng)用程序。為了更好地理解 CNN,我們將首先討論經(jīng)典的線性規(guī)劃。
本文重點(diǎn)介紹卷積神經(jīng)網(wǎng)絡(luò) (CNN) 的特性和應(yīng)用,主要用于模式識(shí)別和對(duì)象分類。在之前文章中,我們展示了微控制器中經(jīng)典線性程序執(zhí)行與 CNN 的區(qū)別及其優(yōu)勢(shì)。我們討論了 CIFAR 網(wǎng)絡(luò),利用該網(wǎng)絡(luò)可以對(duì)圖像中的貓、房屋或自行車等對(duì)象進(jìn)行分類,或執(zhí)行簡(jiǎn)單的語(yǔ)音模式識(shí)別。本文解釋了如何訓(xùn)練這些神經(jīng)網(wǎng)絡(luò)來解決問題。
AI應(yīng)用程序需要大量的能源消耗,通常是以服務(wù)器儲(chǔ)存所或昂貴的現(xiàn)場(chǎng)可編程門陣列的形式出現(xiàn)。挑戰(zhàn)在于提高計(jì)算能力,同時(shí)保持低能耗和低成本?,F(xiàn)在,人工智能的應(yīng)用正在看到強(qiáng)大的智能邊緣計(jì)算帶來的巨大變化。與傳統(tǒng)的基于硬件的計(jì)算方法相比,基于硬件的卷積神經(jīng)網(wǎng)絡(luò)加速度正以其令人印象深刻的速度和功率,為計(jì)算性能開創(chuàng)一個(gè)新的時(shí)代。通過使傳感器節(jié)點(diǎn)能夠自己做出決定,智能邊緣技術(shù)極大地降低了5G和Wi-Fi網(wǎng)絡(luò)的數(shù)據(jù)傳輸速率。這正在為以前不可能的新興技術(shù)和獨(dú)特應(yīng)用提供動(dòng)力。例如,偏遠(yuǎn)地區(qū)的煙霧/火災(zāi)探測(cè)器或傳感器層面的環(huán)境數(shù)據(jù)分析都已成為現(xiàn)實(shí)--所有這些都隨著電池的使用年限而發(fā)生變化。為了檢驗(yàn)這些功能是如何實(shí)現(xiàn)的,本文探索了一個(gè)CNN的硬件轉(zhuǎn)換,一個(gè)專用的人工智能微控制器。
本系列文章由三部分組成,主要探討卷積神經(jīng)網(wǎng)絡(luò)(CNN)的特性和應(yīng)用。CNN主要用于模式識(shí)別和對(duì)象分類。作為系列文章的第三部分,本文重點(diǎn)解釋如何使用硬件轉(zhuǎn)換卷積神經(jīng)網(wǎng)絡(luò)(CNN),并特別介紹使用帶CNN硬件加速器的人工智能(AI)微控制器在物聯(lián)網(wǎng)(IoT)邊緣實(shí)現(xiàn)人工智能應(yīng)用所帶來的好處。系列文章的前兩篇文章為《卷積神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介:什么是機(jī)器學(xué)習(xí)?——第一部分》和《訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò):什么是機(jī)器學(xué)習(xí)?——第二部分》。
本文是系列文章的第二部分,重點(diǎn)介紹卷積神經(jīng)網(wǎng)絡(luò)(CNN)的特性和應(yīng)用。CNN主要用于模式識(shí)別和對(duì)象分類。在第一部分文章《卷積神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介:什么是機(jī)器學(xué)習(xí)?——第一部分》中,我們比較了在微控制器中運(yùn)行經(jīng)典線性規(guī)劃程序與運(yùn)行CNN的區(qū)別,并展示了CNN的優(yōu)勢(shì)。我們還探討了CIFAR網(wǎng)絡(luò),該網(wǎng)絡(luò)可以對(duì)圖像中的貓、房子或自行車等對(duì)象進(jìn)行分類,還可以執(zhí)行簡(jiǎn)單的語(yǔ)音識(shí)別。本文重點(diǎn)解釋如何訓(xùn)練這些神經(jīng)網(wǎng)絡(luò)以解決實(shí)際問題。
隨著人工智能(AI)技術(shù)的快速發(fā)展,AI可以越來越多地支持以前無法實(shí)現(xiàn)或者難以實(shí)現(xiàn)的應(yīng)用。本系列文章基于此解釋了卷積神經(jīng)網(wǎng)絡(luò)(CNN)及其對(duì)人工智能和機(jī)器學(xué)習(xí)的意義。CNN是一種能夠從復(fù)雜數(shù)據(jù)中提取特征的強(qiáng)大工具,例如識(shí)別音頻信號(hào)或圖像信號(hào)中的復(fù)雜模式就是其應(yīng)用之一。本文討論了CNN相對(duì)于經(jīng)典線性規(guī)劃的優(yōu)勢(shì),后續(xù)文章《訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò):什么是機(jī)器學(xué)習(xí)?——第二部分》將討論如何訓(xùn)練CNN模型,系列文章的第三部分將討論一個(gè)特定用例,并使用專門的AI微控制器對(duì)模型進(jìn)行測(cè)試。
卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展,最早可以追溯到1962年,Hubel和Wiesel對(duì)貓大腦中的視覺系統(tǒng)的研究。1980年,一個(gè)日本科學(xué)家福島邦彥(Kunihiko Fukushima)提出了一個(gè)包含卷積層、池化層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。在這個(gè)基礎(chǔ)上,Yann Lecun將BP算法應(yīng)用到這個(gè)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的訓(xùn)練上,就形成了當(dāng)代卷積神經(jīng)網(wǎng)絡(luò)的雛形。
摘 要 :針對(duì)傳統(tǒng)神經(jīng)網(wǎng)絡(luò)需要人工對(duì)參數(shù)進(jìn)行提取的問題,提出基于 Leap Motion 結(jié)合卷積神經(jīng)網(wǎng)絡(luò)的手勢(shì)識(shí)別方法。首先利用 Leap Motion 獲取高精度手勢(shì)圖像,然后對(duì)圖像進(jìn)行灰度處理,采用卷積神經(jīng)網(wǎng)絡(luò)算法自動(dòng)對(duì)原始圖像進(jìn)行特征提取及分類,最后設(shè)計(jì) 6 層卷積神經(jīng)網(wǎng)絡(luò)用于手勢(shì)識(shí)別。實(shí)驗(yàn)結(jié)果表明,卷積神經(jīng)網(wǎng)絡(luò)算法在6 種手勢(shì)測(cè)試集上的準(zhǔn)確率可達(dá) 96.5%,且識(shí)別時(shí)間短,模型具有較好的魯棒性。
摘 要 :現(xiàn)代人臉識(shí)別以深度學(xué)習(xí)技術(shù)為核心,以卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),通過輸入圖像提取到人臉的特征值計(jì)算分析人臉的表情。通過分析當(dāng)前學(xué)生的專注度(表情變化),建立數(shù)據(jù)采集樣本集,通過訓(xùn)練計(jì)算完成課堂專注度分析,形成課堂學(xué)生專注度分布結(jié)果。結(jié)果表明,進(jìn)行教師的課堂學(xué)情分析,有利于進(jìn)行課程的教育教學(xué)改革, 提高辦學(xué)水平,也有利于教育行業(yè)的技術(shù)進(jìn)步,提高行業(yè)的信息技術(shù)教育水平。
摘 要 :手勢(shì)識(shí)別是人工智能范疇的一項(xiàng)生物識(shí)別技術(shù),其方便、快捷、可靠和穩(wěn)定等一系列特性使其在多個(gè)領(lǐng)域具有廣泛應(yīng)用。如拍照和視頻中使用手勢(shì)增加貼紙和實(shí)時(shí)特效,將復(fù)雜的手語(yǔ)轉(zhuǎn)化為自然語(yǔ)言,智能家居的輔助控制,輔助駕駛系統(tǒng)等。神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于圖像識(shí)別領(lǐng)域,具有較好的口碑。文章基于深度學(xué)習(xí)理論設(shè)計(jì)一種識(shí)別精度高,能夠?qū)崿F(xiàn)實(shí)時(shí)手勢(shì)識(shí)別的算法。
作者|小白來源|小白學(xué)視覺疲勞駕駛:一個(gè)嚴(yán)重的問題美國(guó)國(guó)家公路交通安全管理局估計(jì),每年有91,000起車禍涉及疲勞駕駛的司機(jī),造成約50,000人受傷和近800人死亡。此外,每24名成年司機(jī)中就有1人報(bào)告在過去30天內(nèi)在駕駛時(shí)睡著了。研究甚至發(fā)現(xiàn),超過20個(gè)小時(shí)不睡覺相當(dāng)于血液酒...
摘 要:當(dāng)前,采用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像目標(biāo)檢測(cè)和識(shí)別是一大研究熱點(diǎn),并取得了不少研究成果。這些成果在研究過程中使用大量有標(biāo)簽的訓(xùn)練樣本作為訓(xùn)練集起了至關(guān)重要的作用。文章以人臉識(shí)別為例,闡述了多樣本獲取現(xiàn)狀;討論了基于傳統(tǒng)方法的多樣本算法研究現(xiàn)狀和基于深度學(xué)習(xí)的多樣本算法研究現(xiàn)狀;最后展望了多樣本算法未來的發(fā)展方向。
摘 要:文中對(duì)傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)Lenet-5的結(jié)構(gòu)進(jìn)行了改進(jìn),并利用拍攝的實(shí)景交通標(biāo)志圖對(duì)其進(jìn)行訓(xùn)練。訓(xùn)練集含有10萬張圖片,訓(xùn)練大約消耗了一天時(shí)間,盡管如此,當(dāng)網(wǎng)絡(luò)訓(xùn)練好之后,識(shí)別一張交通標(biāo)志圖可以在1毫秒內(nèi)完成。非訓(xùn)練集的2萬張圖片被用作測(cè)試集來驗(yàn)證已訓(xùn)練好的網(wǎng)絡(luò),最終識(shí)別率可達(dá)80%以上。
目前,作為深度學(xué)習(xí)的代表算法之一,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)在計(jì)算機(jī)視覺、分類等領(lǐng)域上,都取得了當(dāng)前最好的效果。
20世紀(jì)60年代,Hubel和Wiesel在研究貓腦皮層中用于局部敏感和方向選擇的神經(jīng)元時(shí)發(fā)現(xiàn)其獨(dú)特的網(wǎng)絡(luò)結(jié)構(gòu)可以有效地降低反饋神經(jīng)網(wǎng)絡(luò)的復(fù)雜性,繼而提出了卷積神經(jīng)網(wǎng)絡(luò)CNN(ConvoluTI
在人工智能(AI)深度學(xué)習(xí)的領(lǐng)域中,卷積神經(jīng)網(wǎng)絡(luò)(ConvoluTIonal Neural Network;CNN)已是目前最具代表性的發(fā)展技術(shù)之一;然而不論是CNN模型或臨床醫(yī)師,在針對(duì)視網(wǎng)膜
無人機(jī)技術(shù)的發(fā)展十分迅速。從美軍無人機(jī)的使用,到現(xiàn)在無人機(jī)在研究、民用等多方面的普及,無人機(jī)已成為一種新的潮流[1-2]。隨之而來也帶來很多新問題,此前無人機(jī)險(xiǎn)撞戰(zhàn)機(jī)事件的發(fā)生,就給人們敲響了警
卷積神經(jīng)網(wǎng)絡(luò) 經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖 圖2 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖 卷積神經(jīng)網(wǎng)絡(luò)和全連接的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)上的差異還是比較大的,全連接的網(wǎng)絡(luò),相鄰兩層的節(jié)點(diǎn)都有邊相連,
人們常說眼睛是心靈的窗戶,但是谷歌的研究人員把它們視作人們健康的指示器。谷歌正借助深度學(xué)習(xí)技術(shù),通過分析人們的視網(wǎng)膜圖像預(yù)測(cè)一個(gè)人的血壓、年齡和吸煙狀態(tài)。谷歌的計(jì)算機(jī)能夠從血管的排布中獲取線索,
前面幾篇文章講到了卷積神經(jīng)網(wǎng)絡(luò)CNN,但是對(duì)于它在每一層提取到的特征以及訓(xùn)練的過程可能還是不太明白,所以這節(jié)主要通過模型的可視化來神經(jīng)網(wǎng)絡(luò)在每一層中是如何訓(xùn)練的。我們知道,神經(jīng)網(wǎng)絡(luò)本身包含了一系