當前位置:首頁 > 智能硬件 > 人工智能AI
[導讀] 得益于人工智能,機器學習和計算機視覺等融合技術的進步,機器人每天都能看到,分析和做出更像人類的決策。開發(fā)此類視覺分析邏輯涉及實現(xiàn)解決方案,這些解決方案可以確定對象的方向,處理移動的對象并執(zhí)行導航

得益于人工智能,機器學習計算機視覺等融合技術的進步,機器人每天都能看到,分析和做出更像人類的決策。開發(fā)此類視覺分析邏輯涉及實現(xiàn)解決方案,這些解決方案可以確定對象的方向,處理移動的對象并執(zhí)行導航。為此的基礎始于兩項重要任務:

一、預處理通過傳感器從現(xiàn)實世界收集的數(shù)據(jù),以使各個子系統(tǒng)將其變?yōu)楦捎玫臓顟B(tài)

二、執(zhí)行特征檢測以從數(shù)據(jù)中提取視覺特征,例如角,邊等。

這些系統(tǒng)到位后,可以繼續(xù)使用更高級別的機器人視覺功能,即:對象檢測和分類以及對象跟蹤和導航。

檢測物體和方向

由于視點的變化,不同尺寸的圖像和動態(tài)照明條件,物體檢測和分類在傳統(tǒng)上一直具有挑戰(zhàn)性??梢蕴峁椭囊环N解決方案是,使用經過訓練以檢測和分類對象的神經網絡。

一種流行的方法是使用卷積神經網絡(CNN),其中圖像的一小部分以稱為“滑動窗口”的過程被饋送到網絡中。另一個任務是確定對象的方向,這對于對象交互和導航都很重要。這里的主要挑戰(zhàn)是確定對象或機器人本身在3D世界空間中的方向。一種流行的方法是應用單應性算法(例如線性最小二乘法求解器,隨機采樣和共識(RANSAC))以及最小二乘方中值來計算2D圖像幀之間的點。一旦檢測到對象,就可以為它們分配元數(shù)據(jù),例如ID,邊界框等,這些元數(shù)據(jù)可以在對象檢測和導航期間使用。

可以檢測和識別物體和人

識別出周圍環(huán)境的物體和方面后,機器人需要對其進行跟蹤。由于對象可以移動,并且機器人的視口會隨著導航而變化,因此開發(fā)人員將需要一種機制來隨時間推移以及跨攝像機和其他傳感器捕獲的幀跟蹤這些元素。由于此機制必須足夠快才能運行每個幀,因此多年來,已經設計了許多算法,這些算法以不同的方式解決該問題。

例如,質心跟蹤會計算跨幀的已標識對象周圍的邊界框的中心點,然后在假定對象每幀僅移動一定距離的假設下計算該點變化時該點之間的距離。另一種方法是使用卡爾曼濾波器,該濾波器使用一段時間內的統(tǒng)計數(shù)據(jù)來預測對象的位置。

替代地,均值漂移算法是一種基本上找到幀的子區(qū)域內圖像的某些方面(例如,顏色直方圖)的均值的方法。然后,通過尋求最大化特征的相似性,在下一幀中尋找相同的描述。這使它能夠解決諸如比例,方向等變化,并最終跟蹤對象的位置。

由于這些技術僅需要跟蹤原始特征的子集,因此它們通??梢愿咝页晒Φ靥幚碇T如方向或遮擋等變化,從而使它們對于機器人視覺處理非常有效。

但是對象并不是唯一需要跟蹤的東西。機器人本身應該能夠成功地導航其環(huán)境,這就是同步定位和地圖(SLAM)出現(xiàn)的地方。SLAM試圖估算機器人的位置并得出環(huán)境圖??梢允褂迷S多算法(例如卡爾曼濾波器)來實現(xiàn)。SLAM通常通過融合來自多個傳感器的數(shù)據(jù)來實現(xiàn),并且當涉及視覺數(shù)據(jù)時,該過程通常稱為視覺慣性同時定位和映射(VISLAM)。

應用來自多個傳感器的多個過濾器以收集跟蹤信息。當然,SLAM只能達到機器人可以感知的水平,因此開發(fā)人員應選擇高質量的相機和傳感器,并找到確保其不受數(shù)據(jù)捕獲影響的方法。從安全角度考慮,開發(fā)人員還應設計故障保險柜,以防萬一無法獲取數(shù)據(jù)(例如,攝像機被遮蓋)。

下一代利用計算機視覺和機器學習技術的機器人,具有“查看”周圍環(huán)境,“分析”動態(tài)場景或變化的條件以及“做出決定”的能力,因此更加先進。這將要求開發(fā)人員精通用于對象檢測和分類以及對象跟蹤和導航的高級機器人視覺功能和工具。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉