配備“千里眼”和“最強大腦”,自動駕駛汽車毫無疑問已經(jīng)初具無障礙行駛的能力了。
據(jù)了解,目前,主流自動駕駛汽車對車輛、行人或是動物的識別準(zhǔn)確率日漸提升,這得益于它們裝備的不同的傳感設(shè)備和算法系統(tǒng)。但多數(shù)人沒想到的是,道路上那些最輕、最安靜、最靈活的小車,可能成為自動駕駛在未來的最大挑戰(zhàn)。
背景:“小”麻煩
“自行車可能成為自動駕駛系統(tǒng)面臨的,最艱難的檢測難題”,來自加州大學(xué)伯克利分校的研究工程師Steven Shladover如是說。
加州大學(xué)的視覺計算專家Nuno Vasconcelos也表達了類似的觀點,他認(rèn)為自行車正因相對小巧、靈活并且結(jié)構(gòu)特殊,可能會使自動駕駛汽車面臨一種復(fù)雜的計算難題。“汽車就像一個‘龐然大物’,但自行車的質(zhì)量就小得多,而且它們的外形各不相同——比如不同形狀、不同顏色、不同掛飾等等。”
這也解釋了一個問題,就是為什么近年來自動駕駛車對汽車的檢測正確率已經(jīng)超過了自行車。當(dāng)然,其中也包括一些算法訓(xùn)練的原因。目前自動駕駛汽車的路況檢測算法,一大部分是基于圖像的深度學(xué)習(xí),而主要的“學(xué)習(xí)”對象是汽車特征,自行車則相對較少。
轉(zhuǎn)機:算法顛覆
話說到這兒,就要祭出一個近期剛剛發(fā)布的神秘算法了。這個“神秘”更多不在于算法本身,而是其頗為有趣的研究團隊陣容。我們了解到,去年年底,這幾位研究人員發(fā)布了他們名為“Deep3DBox”的算法論文。
從上圖就看得出,論文由三人合力完成,其中一人來自喬治?梅森大學(xué),而另外兩位,則來自極盡低調(diào)之能卻被炒得聲名在外的,無人駕駛汽車創(chuàng)業(yè)公司Zoox。
了解這一領(lǐng)域的人應(yīng)該對Zoox多少有所耳聞,這家坐標(biāo)美國硅谷的初創(chuàng)公司致力于無人駕駛汽車研發(fā)。去年10月,一筆高達5000萬融資過后,Zoox身價已經(jīng)一躍達到了10億美元。雖然Zoox可能壓根兒沒有“外宣”部門,但它的技術(shù)員工陣容十分強大,一些資料顯示,部分員工曾供職于谷歌、蘋果、特斯拉等公司。
回到三人共同研發(fā)的最新算法“Deep3DBox”,用頗為外行的話解釋,就是這種算法獨創(chuàng)了一種方式,能夠從2D照片中提取3D的目標(biāo)檢測和姿態(tài)估計。測試數(shù)據(jù)顯示,Deep3DBox能夠識別89%的車輛,而之前這一記錄保持者(學(xué)術(shù)方向)的成績是70%。
美國商用數(shù)學(xué)軟件MATLB中對上圖提到的“boundingbox”(邊界框)一詞做過定義,即“get the properties of region”,意思是用來度量圖像區(qū)域?qū)傩缘暮瘮?shù)。在許多基于2D圖像的信息識別中,都用到過這個函數(shù),例如車牌識別等等。
在這個背景下,我們就能更直觀地理解圖像識別中,2D boundingbox 和3D boundingbox的區(qū)別。比如,機器人在圖像中用2D boundingbox抓取到一輛汽車,就等于用一個正方形圈出了它,但 3D boundingbox 圈出的卻是一個“立方體”,在空間幾何尺度,3D boundingbox能夠計算出更多的信息。
現(xiàn)在,Deep3DBox正試圖攻破一個更大的挑戰(zhàn):那就是依托他們的算法,將目標(biāo)車輛周圍的2D圖像中的障礙物三維化,以預(yù)測車輛的行進路線。
喬治?梅森大學(xué)的計算機科學(xué)家 Jana Ko?ecká 解釋說,“深度學(xué)習(xí)通常只適用于像素模式下的檢測和識別,但我們找到了一種方法,能使用類似的手段評估出幾何層面上的量級。”Ko?ecká 還有一個特殊的身份,那就是Deep3DBox項目的投資人。
瓶頸:自行車難題
Deep3DBox已經(jīng)較原來的深度學(xué)習(xí)方式有了很大改進,但自行車識別依然是他們的難題。
團隊發(fā)現(xiàn),每當(dāng)算法涉及到為自行車定位和定向時,其識別性能會顯著下降。在基準(zhǔn)測試中,算法的目標(biāo)識別率僅為74%,即便這已經(jīng)算得上同類算法中的最好成績了,但對于自動駕駛汽車的完美運行卻遠遠不夠。
定向測試中,Deep3DBox判斷對車輛判斷的準(zhǔn)確率達88%,但針對自行車的成績僅為59%。
Ko?ecka指出,相對而言,商業(yè)化的自動駕駛系統(tǒng),其識別的準(zhǔn)確率會更高,因為它們獲取到了足夠多的道路數(shù)據(jù)來訓(xùn)練它們的系統(tǒng)。與此同時,大多數(shù)路測汽車除了視覺算法,還裝配了如激光雷達(LiDAR)等傳感器,這些設(shè)備雖然無法預(yù)測自行車的行進方向,但也可以幫助自動駕駛汽車識別它們并計算相對位置。
之后,高精度地圖又為自動駕駛系統(tǒng)帶來了更大的便捷。譬如Mobileye野心勃勃的道路管理系統(tǒng)(Road Experience Management,REM),他們試圖打造一種非常精確、非常實時的龐大地圖,同時在每輛車上配備可以上傳和下載實時地圖數(shù)據(jù)的軟件,從而達到一種理想狀態(tài)——使汽車僅僅依賴導(dǎo)航就完成自動駕駛。這非常類似于SLAM(即時定位于地圖構(gòu)建)的變種,但又遠遠沒有那么簡單。
上面介紹的地圖,能夠先一步將自行車識別為道路異常,而后或許再由視覺算法處理。去年,福特汽車聯(lián)合5家公司投資高精度地圖初創(chuàng)公司Civil Maps,研發(fā)用于自動駕駛汽車的3D地圖。福特方面已經(jīng)透露,今年開展路測的自動駕駛汽車將裝配“高精度3D地圖”。
將上述的技術(shù)有機結(jié)合,就能夠獲得更加理想的結(jié)果,例如谷歌去年剛發(fā)布的“自行車識別”技術(shù)。在新版本的技術(shù)中,谷歌提升了無人車對自行車的識別水平,并加入了自行車車主手勢(表達變換車道、轉(zhuǎn)向)識別等新算法,這正是為了避免其過去無法正確識別自行車行進情況的問題。
在剛剛落幕不久的2017底特律車展上,谷歌進一步升級了自行車識別算法,并推出了專門針對自行車的傳感器技術(shù)。
商用:忌操之過急
加州大學(xué)視覺計算專家Vasconcelos依然對當(dāng)下的傳感和自動化技術(shù)能否取代人類保有質(zhì)疑,但他相信,目前的技術(shù)已經(jīng)能夠幫助人類司機避免一些事故的發(fā)生。
未來,自行車自動檢測和識別面向商用化的第一步,很可能就是用于傳統(tǒng)車輛的自動緊急剎車系統(tǒng)(AEB)。目前,AEB系統(tǒng)的功能已經(jīng)從單純的車輛檢測延伸到行人、自行車檢測等更大范疇。
2013年,沃爾沃開始提供第一款支持自行車檢測的AEB系統(tǒng),系統(tǒng)搭載了攝像頭和雷達等設(shè)備,用于潛在的碰撞預(yù)警。今年歐洲的公共巴士中也裝備了類似功能,值得一提的是,歐盟早在四五年前,就發(fā)布規(guī)定,要求新車配備AEB系統(tǒng)。
如今,越來越多的車企也在追隨“歐洲模式”,期望將自行車檢測功能加入AEB系統(tǒng)的性能評級中。
也就是說,AEB系統(tǒng)未來的要應(yīng)對的問題就更復(fù)雜了,甚至是和自動駕駛車研發(fā)人員面臨相同的挑戰(zhàn)。而這個挑戰(zhàn),就是“預(yù)測障礙物的行進”。而其中最最嚴(yán)苛的要求,莫過于對自行車進行檢測預(yù)警的AEB系統(tǒng),負(fù)責(zé)歐洲自行車-AEB系統(tǒng)基準(zhǔn)測試的高級顧問Op den Camp指出,自行車的移動幾乎是最難被預(yù)測的。
Ko?ecká也同意這個觀點,“自行車的可預(yù)測性比汽車低很多,因為它們很容易突然轉(zhuǎn)向或消失在視野中”。
這些觀點都意味著,將自行車排除在人為事故風(fēng)險之外(美國管理機構(gòu)數(shù)據(jù),94%的交通事故由人為失誤造成)尚需日時。舊金山自行車聯(lián)盟的執(zhí)行董事Brian Wiedenmeier說,“每個騎自行車的人都在期盼這項技術(shù)的到來”,但他也同時表示,應(yīng)靜待自動化技術(shù)成熟再投入使用。
據(jù)了解,去年12月,Uber曾在加州某試點測試自動駕駛出租車服務(wù),Wiedenmeier那時就對Uber發(fā)出過警告。他指出,這些汽車無視當(dāng)?shù)貙樽孕熊噭澏ǖ能嚨谰€,這違背了加州保護自行車騎行者安全的相關(guān)法規(guī)。
去年底,Uber一路與加州監(jiān)管部門死扛,加州希望Uber獲得DMV(美國車輛管理局)許可后上路,但Uber無視繼續(xù)路測,之后這種行為遭到禁止。
目前,Uber的自動駕駛汽車仍在亞利桑那州和匹茲堡進行路測,而就在不久前,加州街頭也重現(xiàn)一些Uber路測車的身影,不過消息顯示,這些車輛只被允許收集舊金山街道的測繪地圖數(shù)據(jù),并必須保證有人類駕駛員在車內(nèi)。
Wiedenmeier說,Uber對市場的“急功近利”行為是錯誤的。“任何新技術(shù)都需要審慎地測試和檢驗。