機器學(xué)習(xí)從云端到終端 也能在嵌入式設(shè)備上實現(xiàn)
開發(fā)者需要能夠快速開發(fā)出實施機器學(xué)習(xí)功能的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),并將其轉(zhuǎn)換到低功耗的嵌入式終端設(shè)備上,集成了神經(jīng)網(wǎng)絡(luò)算法的DSP芯片將成為這一難題的解決方案。
終端設(shè)備智能化的需求催生本地智能化(local intelligence)
當聯(lián)網(wǎng)的終端設(shè)備越來越多時,產(chǎn)生的信息數(shù)據(jù)也將呈指數(shù)式增長。如果將所有數(shù)據(jù)和數(shù)據(jù)處理全部都交給云端,必然會產(chǎn)生通信擁堵、傳輸變慢、處理時延等問題,無用的數(shù)據(jù)也會浪費云端的存儲資源。
因此需要本地智能(local intelligence)讓終端設(shè)備有能力判斷數(shù)據(jù)的價值,只將真正有價值的數(shù)據(jù)傳到云端存儲。而終端設(shè)備也需要分析數(shù)據(jù)做出決策的智能化功能,尤其家庭中的圖像識別和語音識別設(shè)備需要在本地實時處理信息,以保護用戶的隱私。
近來,具備深度學(xué)習(xí)功能的卷積神經(jīng)網(wǎng)絡(luò)(CNN)在圖像處理和計算機視覺領(lǐng)域得到廣泛的應(yīng)用,其識別正確率也大大提高。在一些生活場景中,如無人機自動避障、家庭服務(wù)機器人路徑規(guī)劃等,需要將這些神經(jīng)網(wǎng)絡(luò)應(yīng)用到嵌入式設(shè)備上,甚至是一些低功耗的嵌入式設(shè)備,以提高設(shè)備的智能化程度和與人的交互能力。
▲深度學(xué)習(xí)技術(shù)取得顯著成效
與神經(jīng)網(wǎng)絡(luò)深度結(jié)合的DSP處理器將成為機器學(xué)習(xí)的實施方案
目前,因為內(nèi)存、功耗、計算能力等限制,在傳統(tǒng)CPU+GPU架構(gòu)的嵌入式設(shè)備上實施神經(jīng)網(wǎng)絡(luò)還有難度。業(yè)界需要一種將神經(jīng)網(wǎng)絡(luò)引入到低功耗嵌入式設(shè)備的方法。
11月23日,全球領(lǐng)先的信號處理器IP授權(quán)公司CEVA在深圳召開了年度技術(shù)研討會,并發(fā)布了專為在低功耗嵌入式設(shè)備上實現(xiàn)深度學(xué)習(xí)和人工智能應(yīng)用的第五代圖像處理器IP CEVA-XM6。
其主要參數(shù)包括:最高頻率1.5GHz;采用8路VLIW以提高并行計算能力;創(chuàng)新矢量處理單元架構(gòu),確保95%以上的MAC利用率;32路SIMD矢量浮點單元可選項,支持IEEE半精度標準及常用的非線性運算增強。
為了讓開發(fā)者更好的使用CEVA-XM6,CEVA還提供基于CEVA-XM6的軟件開發(fā)平臺,包括硬件加速器、神經(jīng)網(wǎng)絡(luò)軟件框架、軟件庫、CDNN 工具包。CDNN是CEVA的一套深度學(xué)習(xí)綜合開發(fā)工具包,這次研討會發(fā)布了其第二代產(chǎn)品。用戶可以先在線下訓(xùn)練深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型,然后使用 CEVA網(wǎng)絡(luò)生成器將線下的網(wǎng)絡(luò)模型轉(zhuǎn)換成適用于CEVA-XM6處理器的實時嵌入式網(wǎng)絡(luò)。
▲CDNN開發(fā)包與CEVA-XM6軟硬件組合使用
在研討會上,CEVA給出了一個對比案例,使用CEVA-XM6處理器的參考設(shè)計開發(fā)板,相比于NVidia今年推出的TX1 GPU在實現(xiàn)AlexNet和GoogleNet兩種神經(jīng)網(wǎng)絡(luò)時,處理速度快4倍,同時能耗效率提高25倍,十分適合應(yīng)用在低功耗的嵌入式設(shè)備上,如智能攝像、人臉識別、無人機、全景拼接、3D重建等。
▲CEVA-XM6的應(yīng)用場景
具備機器學(xué)習(xí)功能的終端設(shè)備將催生更多的應(yīng)用場景
智能家居要真正做到智能化,與用戶之間良好的交互能力必不可少,比如語音控制、手勢控制等,這些都需要產(chǎn)品具有深度學(xué)習(xí)的功能,能夠識別出用戶的語音命令和手勢動作。
在本次研討會上,美國的一家語音處理技術(shù)公司展示了他們基于CEVA的處理器IP開發(fā)的低功耗語音控制芯片方案,應(yīng)用于智能手機、智能家居的語音交互和語音控制,工作電流低于1mA,可以去除靜態(tài)和非靜態(tài)噪聲,根據(jù)使用場景做定制化開發(fā),通過前期的語音訓(xùn)練后能夠只識別主人的語音,過濾其他人的語音命令,防止別人的誤操作。
在機器視覺領(lǐng)域, Arcsoft公司展示了他們的最新的照片美化技術(shù),除了傳統(tǒng)的白膚、瘦臉等美顏功能外,還可以基于圖像識別分析出拍攝對象的年齡、性別、人種、情緒和拍攝環(huán)境(如白天、夜晚)等因素,針對不同場景和對象做定制化美顏處理,省去了用photoshop做后期處理的環(huán)節(jié),讓一個普通人也可以非常簡便地拍出專業(yè)級的美麗圖片。他們還推出了畫面防抖功能,當用戶手持相機走動拍攝視頻時,通過處理可以使畫面保持靜止狀態(tài),消除走動帶來的畫面抖動。
總結(jié)
隨著技術(shù)的發(fā)展,原本只能在大型高功耗計算平臺上實現(xiàn)的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),將逐步在低功耗嵌入式設(shè)備上實現(xiàn),使得人工智能離我們的日常生活又近了一步,也提高了物聯(lián)網(wǎng)設(shè)備的智能化程度。在產(chǎn)品開發(fā)上,軟硬件深度結(jié)合的開發(fā)模式將越來越普遍(比如CEVA推出的CDNN開發(fā)包與CEVA-XM6的組合使用),基于特定場景應(yīng)用的算法優(yōu)化和數(shù)據(jù)訓(xùn)練之后的智能設(shè)備才能跟人們的日常生活無縫對接,物聯(lián)網(wǎng)技術(shù)與具體行業(yè)具體領(lǐng)域的聯(lián)系將會越來越緊密。