機(jī)器人視覺(jué)識(shí)別技術(shù)簡(jiǎn)介

時(shí)間：2012-08-15 13:46:40

關(guān)鍵字：機(jī)器人視覺(jué) 視覺(jué)識(shí)別識(shí)別技術(shù) RGB

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]基于顏色特征的物體識(shí)別系統(tǒng)對(duì)于不同顏色的分別提取和識(shí)別(以上兩幅圖片由某大學(xué)機(jī)器人實(shí)驗(yàn)室負(fù)責(zé)人暨機(jī)器人天空主編Liu Weichao友情提供)隨著計(jì)算機(jī)科學(xué)和自動(dòng)控制技術(shù)的發(fā)展，越來(lái)越多的不同種類的智能機(jī)器人出現(xiàn)在

基于顏色特征的物體識(shí)別系統(tǒng)對(duì)于不同顏色的分別提取和識(shí)別

(以上兩幅圖片由某大學(xué)機(jī)器人實(shí)驗(yàn)室負(fù)責(zé)人暨機(jī)器人天空主編Liu Weichao友情提供)

隨著計(jì)算機(jī)科學(xué)和自動(dòng)控制技術(shù)的發(fā)展，越來(lái)越多的不同種類的智能機(jī)器人出現(xiàn)在生產(chǎn)生活中，視覺(jué)系統(tǒng)作為智能機(jī)器人系統(tǒng)中一個(gè)重要的子系統(tǒng)，也越來(lái)越受到人們的重視。

視覺(jué)系統(tǒng)是一個(gè)非常復(fù)雜的系統(tǒng)，它既要做到圖像的準(zhǔn)確采集還要做到對(duì)外界變化反應(yīng)的實(shí)時(shí)性，同時(shí)還需要對(duì)外界運(yùn)動(dòng)的目標(biāo)進(jìn)行實(shí)時(shí)跟蹤。因此，視覺(jué)系統(tǒng)對(duì)硬件和軟件系統(tǒng)都提出了較高的要求。目前比較流行的足球機(jī)器人技術(shù)，它的視覺(jué)系統(tǒng)屬于比較典型的快速識(shí)別和反應(yīng)類型。

機(jī)器視覺(jué)系統(tǒng)是指用計(jì)算機(jī)來(lái)實(shí)現(xiàn)人的視覺(jué)功能，也就是用計(jì)算機(jī)來(lái)實(shí)現(xiàn)對(duì)客觀的三維世界的識(shí)別。人類視覺(jué)系統(tǒng)的感受部分是視網(wǎng)膜，它是一個(gè)三維采樣系統(tǒng)。三維物體的可見(jiàn)部分投影到網(wǎng)膜上，人們按照投影到視網(wǎng)膜上的二維的像來(lái)對(duì)該物體進(jìn)行三維理解(對(duì)被觀察對(duì)象的形狀、尺寸、離開(kāi)觀察點(diǎn)的距離、質(zhì)地和運(yùn)動(dòng)特征等的理解)。

機(jī)器視覺(jué)系統(tǒng)的輸入裝置可以是攝像機(jī)、轉(zhuǎn)鼓等，它們都把三維的影像作為輸入源，即輸入計(jì)算機(jī)的就是三維管觀世界的二維投影。如果把三維客觀世界到二維投影像看作是一種正變換的話，則機(jī)器視覺(jué)系統(tǒng)所要做的是從這種二維投影圖像到三維客觀世界的逆變換，也就是根據(jù)這種二維投影圖像去重建三維的客觀世界。

機(jī)器視覺(jué)系統(tǒng)主要由三部分組成：圖像的獲取、圖像的處理和分析、輸出或顯示。圖像的獲取實(shí)際上是將被測(cè)物體的可視化圖像和內(nèi)在特征轉(zhuǎn)換成能被計(jì)算機(jī)處理的一系列數(shù)據(jù)，它主要由三部分組成：照明，圖像聚焦形成，圖像確定和形成攝像機(jī)輸出信號(hào)。視覺(jué)信息的處理技術(shù)主要依賴于圖像處理方法，它包括圖像增強(qiáng)、數(shù)據(jù)編碼和傳輸、平滑、邊緣銳化、分割、特征抽取、圖像識(shí)別與理解等內(nèi)容。經(jīng)過(guò)這些處理后，輸出圖像的質(zhì)量得到相當(dāng)程度的改善，既改善了圖像的視覺(jué)效果，又便于計(jì)算機(jī)對(duì)圖像進(jìn)行分析、處理和識(shí)別。

機(jī)器人視覺(jué)系統(tǒng)主要是利用顏色、形狀等信息來(lái)識(shí)別環(huán)境目標(biāo)。以機(jī)器人對(duì)顏色的識(shí)別為例：當(dāng)攝像頭獲得彩色圖像以后，機(jī)器人上的嵌入計(jì)算機(jī)系統(tǒng)將模擬視頻信號(hào)數(shù)字化，將像素根據(jù)顏色分成兩部分：感興趣的像素(搜索的目標(biāo)顏色)和不感興趣的像素(背景顏色)。然后，對(duì)這些感興趣的像素進(jìn)行RGB 顏色分量的匹配。為了減少環(huán)境光強(qiáng)度的影響，可把RGB顏色域空間轉(zhuǎn)化到HIS顏色空間。

在足球機(jī)器人的彩色視覺(jué)系統(tǒng)中，程序是根據(jù)貼在機(jī)器人小車(chē)頂上的色標(biāo)來(lái)識(shí)別機(jī)器人是屬于哪一隊(duì)，以及是幾號(hào)隊(duì)員的。由于在每個(gè)機(jī)器人小車(chē)頂上有兩種顏色的色標(biāo)，分別是隊(duì)標(biāo)和隊(duì)員標(biāo)。因此，識(shí)別工作的第一步是把圖像中的每一個(gè)像素，根據(jù)顏色分類到一組離散的色彩類中。

顏色分類常用的方法有線性色彩閾值法、最近鄰域法和閾值向量法等。

其中，線性色彩閾值法是用線性平面把色彩空間分割開(kāi)來(lái)，其閾值的確定可采用直接取閾值和通過(guò)自動(dòng)訓(xùn)練來(lái)獲取目標(biāo)顏色范圍等方法，也可以采用神經(jīng)網(wǎng)絡(luò)和多參數(shù)決策樹(shù)方法來(lái)進(jìn)行自學(xué)習(xí)，以獲得合適的閾值;而用最近鄰域分類法分割圖像時(shí)，則利用隸屬度函數(shù)，即根據(jù)最大的隸屬度來(lái)判斷這個(gè)顏色屬于哪個(gè)類;閾值向量法是先使用一組事先確定的閾值向量來(lái)把色彩值在色彩空間中的位置來(lái)判斷其屬于哪種顏色。

在色彩分類之后，必須對(duì)各個(gè)顏色類的點(diǎn)進(jìn)行處理，最終辨識(shí)出場(chǎng)上的各個(gè)敵我隊(duì)員和球在場(chǎng)上的位置和方向角。識(shí)別時(shí)，通常的做法是對(duì)分類后的像素進(jìn)行一次掃描，即將相鄰的同種顏色的像素連成色塊。

基于閾值向量的顏色識(shí)別

一、色彩空間選擇

對(duì)于采用基于彩色圖像分割的方法識(shí)別目標(biāo)時(shí)，首先要選擇合適的顏色空間，常用的顏色空間有RGB、YUV、HSV、CMY等。顏色空間的選擇直接影響到圖像分割和目標(biāo)識(shí)別的效果。

RGB——最常用的顏色空間，其中亮度等于R、G、B3個(gè)分量之和。RGB顏色空間是不均勻的顏色空間，兩個(gè)顏色之間的知覺(jué)差異與空間中兩點(diǎn)間的歐氏距離不成線性比例，而且R、G、B值之間的相關(guān)性很高，對(duì)同一顏色屬性，在不同條件(光源種類、強(qiáng)度和物體反射特性)下，RGB值很分散，對(duì)于識(shí)別某種特定顏色，很難確定其閾值和其在顏色空間中的分布范圍。因此通常會(huì)選擇能從中分離出亮度分量的顏色空間，其中最常見(jiàn)的是YUV和HSV顏色空間。

HSV——接近人眼感知色彩的方式，H為色調(diào)(Hue)，S為色飽和度(Saturation)，V為亮度(Value)。色調(diào)H能準(zhǔn)確地反映顏色種類，對(duì)外界光照條件變化敏感度低，但是H和S均為R、G、B的非線性變換，存在奇異點(diǎn)，在奇異點(diǎn)附近即使R、G、B的值有很小變化也引起變換值有很大的跳動(dòng)。

YUV——RGB顏色空間線性變化為亮度色彩空間。是為了解決彩色電視機(jī)與黑白電視機(jī)的兼容問(wèn)題而提出的。Y表示亮度(Luminance)，UV用來(lái)表示色差(Chrominance)。YUV表示法的重要性是它的亮度信號(hào)(Y)和色度信號(hào)(U、V)是相互獨(dú)立的。所謂色差是指基色信號(hào)中的3個(gè)分量信號(hào)(即R、G、B)與亮度信號(hào)之差。

YUV格式與RGB存在如下關(guān)系：

二、閾值確定和色彩判斷

在確定閾值時(shí)，首先通過(guò)采集樣本進(jìn)行訓(xùn)練，從而得到預(yù)定的幾種顏色在YUV空間的分量的上下閾值，如圖2所示。

當(dāng)一個(gè)待判定的像素在色彩空間中的位置落在這個(gè)長(zhǎng)方體中時(shí)，就認(rèn)為該像素屬于要找的顏色，從而完成對(duì)圖像顏色的識(shí)別。在Y空間中，Y值表示亮度，因它的變化很大，所以只考慮了U和V的值，在進(jìn)行顏色判斷時(shí)，首先分別建立U、V的閾值向量。

在顏色識(shí)別后進(jìn)行圖像分割，在圖像分割中采用了種子填充算法，其整個(gè)種子的填充是和像素點(diǎn)的顏色同時(shí)進(jìn)行的，一開(kāi)始不是對(duì)所有的像素進(jìn)行處理，而是分塊進(jìn)行的。當(dāng)中心點(diǎn)是所要識(shí)別的顏色時(shí)，就以這個(gè)點(diǎn)為種子向四周擴(kuò)散，并判定周?chē)袼攸c(diǎn)的顏色，直到填滿整個(gè)塊。