當(dāng)前位置:首頁 > 公眾號精選 > 電子與信息學(xué)報
[導(dǎo)讀]物體感知是智能機器人的基本技能,是執(zhí)行任務(wù)的基礎(chǔ)。隨著機器人智能化的快速發(fā)展,機器人具備了語言識別與理解、計算機視覺等功能。

中圖分類 TP183:人工神經(jīng)網(wǎng)絡(luò)與計算


貴州大學(xué)李少波等人在《電子與信息學(xué)報》發(fā)表最新論文:

具有正則化約束的脈沖神經(jīng)網(wǎng)絡(luò)機器人觸覺物體識別方法 >>

文章提出了一種基于觸覺的機器人物體識別方法,針對脈沖神經(jīng)網(wǎng)絡(luò)中神經(jīng)元脈沖活動離散性導(dǎo)致網(wǎng)絡(luò)訓(xùn)練過程反向傳播失效問題,引入脈沖活動近似函數(shù);

針對過擬合問題,融合正則化方法加以緩解。實驗分析表明了正則化模型的觸覺物體識別率有顯著提升。

總體而言,該文工作具有較好的創(chuàng)新性和學(xué)術(shù)價值。

背 景

物體感知是智能機器人的基本技能,是執(zhí)行任務(wù)的基礎(chǔ)。隨著機器人智能化的快速發(fā)展,機器人具備了語言識別與理解、計算機視覺等功能。

此外,時下大部分機器人沒有觸覺感知能力,更沒有像人類一樣使用觸覺去感知不同物體的能力,而觸覺傳感器能夠提供溫度、粗糙度、壓力等視覺與聽覺無法提供的信息,能夠輔助智能機器人適應(yīng)更多工作場景。

因此研究機器人觸覺感知方法對促進智能機器人擁有與人類相似的觸覺感知能力具有重要意義。

圖1 機器人觸覺系統(tǒng)

脈沖神經(jīng)網(wǎng)絡(luò)(Spiking Neural Network,SNN)受人類神經(jīng)元工作方式啟發(fā),通過時空動力學(xué)模仿人類神經(jīng)行為,并使用二進制脈沖信號在神經(jīng)元之間進行通信,在生物學(xué)設(shè)計上也更加合理。并且脈沖神經(jīng)網(wǎng)絡(luò)能夠應(yīng)用于神經(jīng)擬態(tài)芯片上,能夠更快地處理AI任務(wù),帶來更高的能效。

然而,相較于傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò),SNN的神經(jīng)元之間由于通過離散的二進制信號0或1傳遞信息,這導(dǎo)致了在采用反向傳播完成參數(shù)更新時,梯度下降法的失效。

此外,模型訓(xùn)練需要大量的數(shù)據(jù)樣本支撐,以得到更優(yōu)的網(wǎng)絡(luò)參數(shù)。而現(xiàn)有機器人觸覺脈沖數(shù)據(jù)樣本較少,如何緩解數(shù)據(jù)量較少導(dǎo)致的過擬合問題得到更優(yōu)的網(wǎng)絡(luò)性能,也是挑戰(zhàn)之一。

為應(yīng)對以上挑戰(zhàn),貴州大學(xué)李少波、楊靜、吉曉陽等人及其合作團隊提出了一種具有正則化約束的脈沖神經(jīng)網(wǎng)絡(luò)機器人觸覺物體識別方法:

首先,作者分析了SNN神經(jīng)元與脈沖活動之間的關(guān)系,并通過脈沖活動的近似函數(shù)緩解梯度下降法在反向傳播中的失效問題。

進一步地,提出了一種具有正則化約束的脈沖神經(jīng)網(wǎng)絡(luò)機器人觸覺物體識別方法,緩解模型的過擬合問題,提升SNN網(wǎng)絡(luò)模型的魯棒性。

實驗結(jié)果顯示,該文方法提出的SnnTd正則化方法觸覺物體識別率在EvTouch-Containers數(shù)據(jù)集上比最好方法TactileSGNet提升了5.00%,SnnTdlc正則化方法觸覺物體識別率在EvTouch-Objects數(shù)據(jù)集上則提升了3.16%。

研究方法

(1) SNN的反向傳播

根據(jù)SNN的預(yù)測結(jié)果,計算網(wǎng)絡(luò)輸出與標簽之間誤差平方和的均值,即網(wǎng)絡(luò)模型損失函數(shù)L在時間窗口T內(nèi)平均投票結(jié)果的均方誤差

其中S為觸覺數(shù)據(jù)訓(xùn)練樣本的總量,是第s個觸覺數(shù)據(jù)樣本的標簽,是輸出層的結(jié)果。對于標簽為的訓(xùn)練樣本,觸覺模型理想情況是代表第類的神經(jīng)元具有最高的輸出值。

圖2 脈沖神經(jīng)網(wǎng)絡(luò)的空域和時域傳播過程

從圖2可以看出,神經(jīng)元前向傳播中,第n層神經(jīng)元膜電位由空域中第n-1層神經(jīng)元的輸出脈沖,以及時域中第n層神經(jīng)元t-1時刻的神經(jīng)元膜電位共同決定。

而在反向傳播過程中,第n層神經(jīng)元膜電位在空域上影響第n-1層神經(jīng)元的輸出脈沖,在時域上影響第n層神經(jīng)元t-1時刻的神經(jīng)元膜電位

綜上,通過復(fù)合函數(shù)的鏈式法則得到損失函數(shù)L與權(quán)重w、偏置b之間的關(guān)系:

其中,表示t時刻第n層脈沖神經(jīng)元的膜電位,表示t時刻第n層是否產(chǎn)生脈沖,若產(chǎn)生脈沖,,否則。

采用連續(xù)函數(shù)模擬脈沖活動的反向傳播,使得梯度下降法有效,即

(2) 正則化約束

Dropout正則化方法通過隨機丟棄神經(jīng)網(wǎng)絡(luò)中網(wǎng)絡(luò)層上的神經(jīng)元,構(gòu)建不同的訓(xùn)練子網(wǎng)絡(luò),使每次訓(xùn)練時采用的網(wǎng)絡(luò)不相同,這類似于在模型中加入高斯噪聲,間接使得模型接收到不同的輸入數(shù)據(jù),緩解數(shù)據(jù)量少的問題,進而使模型的過擬合問題得到緩解。將Dropout方法引入脈沖神經(jīng)網(wǎng)絡(luò),通過隨機丟棄LIF神經(jīng)元,提升神經(jīng)網(wǎng)絡(luò)的預(yù)測能力。圖3展示了LIF神經(jīng)元的Dropout工作方式。

圖3 LIF神經(jīng)元中的Dropout

L2權(quán)重衰減是通過限制權(quán)重的選擇范圍控制模型參數(shù)容量,在一定程度上緩解模型的過擬合問題,通過結(jié)合Adam優(yōu)化算法以及余弦退火算法,作者提出具有L2正則化約束的脈沖神經(jīng)網(wǎng)絡(luò)機器人觸覺物體識別算法。

實驗分析

該文考慮了2個不同的觸覺脈沖數(shù)據(jù)集,并在每個數(shù)據(jù)集上進行了80次實驗,每組實驗重復(fù)10次。


(1)EvTouch-Containers數(shù)據(jù)集

包含4種容器在5種容量(0%, 25%, 50%, 75%, 100%)下的觸覺脈沖數(shù)據(jù),即共有20種不同的觸覺脈沖數(shù)據(jù),每個數(shù)據(jù)劃分為325個時間片段。每種物體采集15次,共300組數(shù)據(jù)。

根據(jù)圖4(a),融合Dropout正則化方法的SnnTdc,SnnTdlc,SnnTd和SnnTdl模型的TrainingLoss收斂值大于其他模型,且引入余弦退火算法模型的收斂值相對更低。從圖4(b)中可以看出,沒有采用余弦退火算法的SnnTl,SnnT,SnnTd和SnnTdl模型在第40 Epoch處TestLoss變化較大。

圖4 EvTouch-Containers數(shù)據(jù)集Loss值變化情況

(2)EvTouch-Objects數(shù)據(jù)集

包含36種不同物體的觸覺脈沖數(shù)據(jù),每個數(shù)據(jù)劃分為250個時間片段。每種物體采集20次,共720組數(shù)據(jù)。

圖5 Acc,TrainingLoss和TestLoss 10次實驗結(jié)果

根據(jù)圖5(a),除SnnTc模型外,其它模型的箱體位置均高于SnnT模型,其中SnnTdlc和SnnTdl模型的位置最高且較小,這表明了這2種模型的Acc值相對穩(wěn)定且值更大。從圖5(b)中可以看出,融合了Dropout正則化方法的SnnTd,SnnTdl,SnnTdc和SnnTdlc的TrainingLoss值的箱體位置較高。

根據(jù)圖5(c),SnnT,SnnTl,SnnTc和SnnTlc模型的TestLoss值的箱體位置處于圖中的下半部分,低于其它4種模型。

(3) 混淆矩陣

混淆矩陣展示了模型在EvTouch-Containers和EvTouch-Objects數(shù)據(jù)集上測試集的分類結(jié)果。根據(jù)圖6(a),SnnTd模型在EvTouch-Containers觸覺脈沖數(shù)據(jù)集上出現(xiàn)預(yù)測錯誤類別主要是第1類到第6類,第16類到第19類。根據(jù)圖6(b),SnnTdlc模型在EvTouch-Objects觸覺脈沖數(shù)據(jù)集上第20類到第36類上全部識別正確,但第16類到第19類出現(xiàn)了識別錯誤的情況。

圖6  正則化模型在不同數(shù)據(jù)集上的混淆矩陣

總結(jié)

面向智能機器人觸覺感知能力,本文針對機器人觸覺物體識別算法展開研究。通過脈沖神經(jīng)網(wǎng)絡(luò)脈沖活動近似函數(shù),緩解網(wǎng)絡(luò)訓(xùn)練中反向傳播梯度下降法失效問題。通過融合正則化方法,緩解觸覺脈沖數(shù)據(jù)量少導(dǎo)致的過擬合問題。

實驗結(jié)果表明,SnnTd正則化方法在EvTouch-Containers數(shù)據(jù)集上的觸覺物體識別率比表現(xiàn)最好的TactileSGNet方法提升了5.00%,SnnTdlc正則化方法的觸覺物體識別率在EvTouch-Objects數(shù)據(jù)集上提升了3.16%。

在后續(xù)的研究中,將重點關(guān)注識別出現(xiàn)錯誤的數(shù)據(jù),進一步完善機器人觸覺物體識別算法,提升模型的識別能力,為將來應(yīng)用于工業(yè)智能機器人觸覺抓取感知以及幫助殘障人士的服務(wù)機器人觸覺感知等場景打下堅實基礎(chǔ)。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉