基于行為的智能吸塵機(jī)器人設(shè)計(jì)
自主吸塵機(jī)器人(AutonomollsCleaningRobot,ACR)又稱為清潔機(jī)器人或智能吸塵器,是移動(dòng)式智能機(jī)器人進(jìn)人家庭的一個(gè)典型應(yīng)用。
其結(jié)合了機(jī)器人和吸塵器的核心技術(shù),能在無人看守情況下輕松地完成實(shí)現(xiàn)家庭、賓館、寫字樓等室內(nèi)環(huán)境的全自動(dòng)清潔。集機(jī)械學(xué)、電子技術(shù)、傳感器技術(shù)、計(jì)算機(jī)技術(shù)、控制技術(shù)、機(jī)器人技術(shù)、人工智能等諸多學(xué)科為一體。吸塵機(jī)器人作為智能移動(dòng)機(jī)器人實(shí)用化發(fā)展的先行者,其研究始于20世紀(jì)80年代,他是目前家用電器領(lǐng)域最具挑戰(zhàn)性的熱門研發(fā)課題。目前國(guó)內(nèi)外在吸塵機(jī)器人研究開發(fā)方面已取得一定的成果,并有成品上市。雖然自主吸塵機(jī)器人已經(jīng)形成產(chǎn)品并推向了市場(chǎng),但其性能還有待進(jìn)一步提高。
l 基于行為
Rodney Brooks在1986年發(fā)表的論文中提到的包容式結(jié)構(gòu)表明了基于行為的編程方法的正式起源。包容式結(jié)構(gòu):在進(jìn)化過程中,人類永遠(yuǎn)不會(huì)喪失比較低級(jí)的和原始的大腦工程,而高級(jí)功能則在此基礎(chǔ)上進(jìn)行添加,因此在每個(gè)人的大腦內(nèi)部都保留有類似于爬行動(dòng)物的低級(jí)意識(shí)殘余。與此類似,采用基于行為的方法需要為機(jī)器人設(shè)計(jì)一系列簡(jiǎn)單行為(所謂的行為也就是通過感知信息控制執(zhí)行過程的算法),這些行為相互協(xié)調(diào)和協(xié)作,產(chǎn)生所需求的機(jī)器人整體行為。系統(tǒng)的行為并不是完全確定的,而是包含了很多隨機(jī)的東西。執(zhí)行過程并不十分穩(wěn)定,但系統(tǒng)的整體行為是非常穩(wěn)定的?;谛袨榈臋C(jī)器人將盡可能地將傳感器信息同執(zhí)行過程直接連接。具有很強(qiáng)的反射性:只要機(jī)器人對(duì)相關(guān)環(huán)境做出了判斷,就立即采取行動(dòng)。一有信息就立即據(jù)此動(dòng)作。
2行為設(shè)計(jì)
行為分為2種類型:伺服行為和彈道式行為。伺服行為采用反饋控制環(huán)作為他的控制單元。彈道式行為,自始至終都會(huì)按照預(yù)先沒定好的模式運(yùn)行。彈道式行為的整體規(guī)劃過程同實(shí)現(xiàn)程序代碼密切相關(guān),執(zhí)行過程中的環(huán)境變化或者行為初始化過程中的任何微小錯(cuò)誤(如噪聲假信號(hào)所導(dǎo)致的誤操作),都會(huì)給機(jī)器人帶來麻煩,導(dǎo)致徹底失效。伺服行為具有良好的抗噪聲能力,對(duì)工作過程中的其他微小故障也具有較強(qiáng)的容錯(cuò)性。 本文的行為采用有限狀態(tài)機(jī)(Finite state Machine,F(xiàn)SM)使能夠更方便地理解系統(tǒng)工作過程,從而可以容易地編寫系統(tǒng)實(shí)現(xiàn)代碼。
2.1 巡航行為
巡航行為是最基本也是機(jī)器人最常使用的行為。該行為使2個(gè)驅(qū)動(dòng)電動(dòng)機(jī)輸出相同的轉(zhuǎn)速,機(jī)器人近似直線的向前方運(yùn)動(dòng),直到其他行為觸發(fā),當(dāng)其他行為運(yùn)行結(jié)束時(shí),將又回復(fù)到巡航行為。
2.2 沿墻行走行為
沿墻行走行為能夠幫助機(jī)器人在障礙物之間搜索路徑。特別是對(duì)于多個(gè)房間的環(huán)境來說,在門的附近進(jìn)行一小段沿墻行走行為將使機(jī)器人更有機(jī)會(huì)進(jìn)入其他的房間,所以機(jī)器人在遇到障礙物時(shí),隔一段時(shí)間需要進(jìn)行一小段沿墻行走行為。如圖1所示:
2.3 歸航行為
歸航行為與泊位傳感器相結(jié)合,使機(jī)器人在電量不足時(shí)能夠回到充電處進(jìn)行充電,以保證任務(wù)能夠完成。實(shí)現(xiàn)機(jī)器人歸航行為的左右2個(gè)紅外信標(biāo)接收器的性能不可能完全一致,當(dāng)機(jī)器人通過比較傳感器輸出確定出自己直接面/對(duì)光源時(shí),其實(shí)際朝向卻偏向光源的一測(cè),機(jī)器人沿著某個(gè)螺旋線向著信標(biāo)的位置前進(jìn)。機(jī)器人前進(jìn)的同時(shí)旋轉(zhuǎn),旋轉(zhuǎn)角度ω=k(L一R),其中k為增益參數(shù);L,R為紅外接受器接收到的接受信號(hào)強(qiáng)度。當(dāng)機(jī)器人電量不足時(shí),機(jī)器人未必處于充電的房間,因此檢測(cè)不到紅外信標(biāo)的信號(hào),此時(shí)應(yīng)觸發(fā)沿墻行走行為使機(jī)器人走到能檢測(cè)到信標(biāo)信號(hào)的房間再觸發(fā)歸航行為。如圖2所示。
2.4 逃離行為
逃離行為能保護(hù)機(jī)器人避免發(fā)生危險(xiǎn),保證任務(wù)得以順利完成。機(jī)器人的旋轉(zhuǎn)角度是用來平衡系統(tǒng)環(huán)境適應(yīng)能力的一個(gè)重要參數(shù)。如果該值較大,那么機(jī)器人將能非常干凈利索地離開墻或者其他比較大的障礙物;但機(jī)器人卻因此而喪失了尋找狹小通路的能力,嚴(yán)重限制了他在錯(cuò)綜復(fù)雜的環(huán)境中進(jìn)行自主導(dǎo)航的能力;如果角度比較小,機(jī)器人將會(huì)比較容易地在凌亂的環(huán)境中穿行,然而在執(zhí)行避開墻壁的操作時(shí)則需反復(fù)多次才能成功,因此應(yīng)選擇隨機(jī)旋轉(zhuǎn)角度。如圖3所示。
2.5 防堵轉(zhuǎn)行為
永磁直流電動(dòng)機(jī)的輸出轉(zhuǎn)矩同電流成正比。當(dāng)電動(dòng)機(jī)兩端施加電壓而電動(dòng)機(jī)沒有旋轉(zhuǎn)時(shí),轉(zhuǎn)矩和電流達(dá)到最大值。如果機(jī)器人同某個(gè)障礙物發(fā)生碰撞,并且驅(qū)動(dòng)輪同地面之間具有很大的摩檫力,那么驅(qū)動(dòng)電動(dòng)機(jī)將會(huì)處于停轉(zhuǎn)狀態(tài)。因此,如果電動(dòng)機(jī)具有最大電流,并且電流已經(jīng)持續(xù)了相對(duì)比較長(zhǎng)的時(shí)間,那么表明機(jī)器人已經(jīng)同環(huán)境中的某個(gè)物體發(fā)生了碰撞。堵轉(zhuǎn)檢測(cè)傳感器只有當(dāng)電動(dòng)機(jī)在高電流狀態(tài)(高于某個(gè)閾值)下持續(xù)了一段時(shí)間才能斷定已發(fā)生碰撞的判斷(電機(jī)啟動(dòng)會(huì)產(chǎn)生瞬間電流峰值)。
2.6防靜止行為
虛擬靜止檢測(cè)傳感器只要通過軟件實(shí)現(xiàn)即可。機(jī)器人在運(yùn)動(dòng)時(shí)各傳感器的輸出信息都可能在不停地變化,而一旦停止運(yùn)動(dòng),所有傳感器的輸出信息都將保持不變。
2.7 系統(tǒng)結(jié)構(gòu)
機(jī)器人的功能和運(yùn)行方式?jīng)Q定了機(jī)器人的結(jié)構(gòu)。系統(tǒng)結(jié)構(gòu)圖如圖4所示。
2.8 差速驅(qū)動(dòng)
差速驅(qū)動(dòng)底盤通過控制2個(gè)驅(qū)動(dòng)輪之間的運(yùn)動(dòng)差異來控制機(jī)器人的整體運(yùn)動(dòng)。無論多么復(fù)雜的運(yùn)動(dòng)都可以分解為平移運(yùn)動(dòng)和原地旋轉(zhuǎn)運(yùn)動(dòng)。圖5為差速驅(qū)動(dòng)模型,描述了2個(gè)驅(qū)動(dòng)輪的速度同機(jī)器人曲率半徑之間的關(guān)系,曲率半徑為rL=VLW/(VR一VL)。當(dāng)兩個(gè)驅(qū)動(dòng)輪的旋轉(zhuǎn)速度完全相同時(shí).半徑rL的值將趨于無窮大,此時(shí)機(jī)器入沿直線行駛的過程可以理解為機(jī)器人沿某個(gè)半徑為無窮大的圓的旋轉(zhuǎn)過程;當(dāng)左輪速度為O時(shí),rL等于0,機(jī)器人將會(huì)圍繞左輪進(jìn)行原地旋轉(zhuǎn)操作,此時(shí)vL=v,Vr=wW+v;當(dāng)左右2個(gè)輪子的速度相同而符號(hào)相反時(shí),機(jī)器人將會(huì)圍繞著自己的中心位置進(jìn)行原地旋轉(zhuǎn)(rL=w/2)。差速驅(qū)動(dòng)機(jī)器人可以圍繞2個(gè)驅(qū)動(dòng)輪軸心連線上的任意一點(diǎn)進(jìn)行旋轉(zhuǎn)操作(包括機(jī)器人本體外的點(diǎn))。負(fù)半徑表示機(jī)器人沿弧線方向逆時(shí)針行駛;正半徑方向表示沿弧線方向順時(shí)針行駛。
3仲裁器設(shè)計(jì)
在某個(gè)時(shí)刻僅有一個(gè)行為觸發(fā),系統(tǒng)能夠比較平穩(wěn)地運(yùn)行。但當(dāng)多個(gè)行為同時(shí)觸發(fā),并且每個(gè)行為都需要機(jī)器人執(zhí)行不同的操作時(shí),機(jī)器人就需要利用仲裁機(jī)制來妥善處理這種關(guān)系。這里采用固定優(yōu)先級(jí)仲裁,每個(gè)行為都被惟一地賦予一個(gè)優(yōu)先級(jí)值,沖突發(fā)生時(shí),執(zhí)行優(yōu)先級(jí)高的行為。行為在發(fā)出控制請(qǐng)求后,需要知道自己是否已經(jīng)得到仲裁器的批準(zhǔn)。仲裁器帶有一定的輸出,每個(gè)行為都賦予一個(gè)惟一標(biāo)識(shí)符(ID:Identifer)。仲裁器輸出仲裁獲勝行為的標(biāo)識(shí)符。每個(gè)行為通過將自己的標(biāo)識(shí)符同仲裁器輸出相比較,能夠確定出自己是否已經(jīng)擁有了對(duì)仲裁資源的控制權(quán)。
機(jī)器人在運(yùn)行時(shí),環(huán)境存在很多不可控因素,機(jī)器人的實(shí)際運(yùn)行方式與所期望的有很大差異,有時(shí)傳感器徹底失效,有時(shí)在信息檢測(cè)過程中經(jīng)常出現(xiàn)漏報(bào)和誤報(bào)錯(cuò)誤(漏報(bào)是指當(dāng)環(huán)境中存在某種傳感器應(yīng)該能夠檢測(cè)到的信息時(shí),傳感器卻檢測(cè)不到;誤報(bào)則是指?jìng)鞲衅魉鶛z測(cè)到的信息在環(huán)境中是不存在或不正確的)。盡管在重要信息損失或者運(yùn)動(dòng)控制命令變質(zhì)的情況下,性能會(huì)受到一定程度的影響,機(jī)器人程序也應(yīng)該能夠盡其可能地做到最好,而不是完全徹底地癱瘓。在子系統(tǒng)發(fā)生錯(cuò)誤或者工作失敗的情況下,系統(tǒng)這種能夠降低水準(zhǔn)繼續(xù)工作的能力被稱為優(yōu)雅降級(jí)。本文設(shè)計(jì)的機(jī)器人具有完善的優(yōu)雅降級(jí)功能(見圖6)。在碰撞傳感器失效的情況下,防堵轉(zhuǎn)和防靜止行為將保證機(jī)器人繼續(xù)完成任務(wù)。
4機(jī)器人仿真及分析
對(duì)以上提出的基于行為吸塵機(jī)器人設(shè)計(jì)方案進(jìn)行仿真,圖7為機(jī)器人在模擬房間中清潔任務(wù)的仿真界面。機(jī)器人采用隨機(jī)覆蓋的模式,不知道自己的具體位置,因此不可避免地會(huì)再次訪問已訪問過的某個(gè)區(qū)域。隨著機(jī)器人的運(yùn)行,覆蓋區(qū)域的增長(zhǎng)速度呈遞減趨勢(shì),區(qū)域覆蓋率則可以近似表達(dá)為:覆蓋率=(1-e-t/a)其中,f為時(shí)間變量;a為一時(shí)間常數(shù)。表明了機(jī)器人在不訪問舊區(qū)域的情況下進(jìn)行確定性覆蓋所花費(fèi)的時(shí)間。通過實(shí)驗(yàn)仿真運(yùn)行情況來看,本文的設(shè)計(jì)方案完全可以滿足要求。雖然隨機(jī)覆蓋方法沒有確定性覆蓋的低重復(fù)性,但他卻能避免確定性覆蓋所帶來的價(jià)格、復(fù)雜性以及系統(tǒng)脆弱性問題。
5 結(jié) 語
基于行為的機(jī)器人設(shè)計(jì)方法不采用價(jià)格昂貴的單一類型傳感器去獲取難以達(dá)到的精度和可靠性,而是綜合使用多個(gè)可靠性相對(duì)來說比較差一些的傳感器系統(tǒng),通過這些系統(tǒng)之間的優(yōu)勢(shì)互補(bǔ)使機(jī)器人具有更強(qiáng)的魯棒性。