自動(dòng)駕駛在未來會(huì)有一席之地嗎
掃描二維碼
隨時(shí)隨地手機(jī)看文章
此文所討論的是指汽車的自動(dòng)駕駛,不是飛機(jī),也不是輪船。
在英文中我們它會(huì)叫做Autonomous Driving,強(qiáng)調(diào)了車具有了自主意識(shí),有自我決策能力甚至可以完全的無人駕駛,也稱為Self-Driving , Driverless 或 Fully Automated Driving ,注意這些不同于Automated Driving,后者還停留在被動(dòng)性的,沒有自我決策的能力,我們常說的高級(jí)輔助駕駛(ADAS-Advanced Driving Assistant System)大約可歸于此。
有不少機(jī)構(gòu)對(duì)自動(dòng)駕駛作過等級(jí)的劃分,但目前最主流的當(dāng)屬SAE(Society of Automotive Engineers)的定義。目前最新版是201806的,參考如下鏈接:
SAE J3016_201806
根據(jù)系統(tǒng)參與駕駛的比重,失效時(shí)如何響應(yīng),以及它的設(shè)計(jì)運(yùn)行范圍。它把自動(dòng)駕駛的級(jí)別分成了5級(jí),如下圖:
DDT Dynamic driving task 動(dòng)態(tài)駕駛?cè)蝿?wù),指汽車在道路上行駛所需的所有實(shí)時(shí)控制操作,主要是一些決策控制類的行為,不包括行程安排、目的地和途徑地的選擇等戰(zhàn)略上的功能。
OEDR Object and event detecTIon and response 是對(duì)車輛周邊環(huán)境監(jiān)控和響應(yīng)的意思,是感知和判斷,可以通過對(duì)物體和事件檢測(cè)、認(rèn)知?dú)w類和并作出后續(xù)響應(yīng)。
DDT Fallback 動(dòng)態(tài)駕駛?cè)蝿?wù)支援,比如系統(tǒng)性的失效或者路況過于復(fù)雜超出了系統(tǒng)的判斷決策能力時(shí),如何進(jìn)行支援??梢钥闯鲈贚evel 2水平時(shí)要完全由司機(jī)來處理,到了Level 3時(shí)系統(tǒng)就有了一定的自主決策能力了。
ODD OperaTIonal Design Domain 是設(shè)計(jì)運(yùn)行域的意思,指自動(dòng)駕駛系統(tǒng)被設(shè)計(jì)的起作用的條件及適用范圍,比如行駛區(qū)域范圍,道路情況(直路、彎路的半徑)、車速等,以確保系統(tǒng)的能力在安全的環(huán)境之內(nèi)。
結(jié)合下圖,對(duì)五個(gè)等級(jí)進(jìn)一步解釋:
Level 1
具有一定的駕駛輔助功能,它在橫向或者縱向控制上二選一,比如加減速或者轉(zhuǎn)向的控制,高速公路上具有定速巡航,車道保持功能的車處于這個(gè)級(jí)別。但所有的駕駛的操作和決策都還是由人完成。
Level 2
可以同時(shí)支持橫向和縱向的控制,但駕駛員仍然需要實(shí)時(shí)監(jiān)控環(huán)境,手要時(shí)刻放在方向盤上,同時(shí)要保證出問題時(shí)隨時(shí)進(jìn)行接管。此時(shí)系統(tǒng)也還不具備決策能力,比如特斯拉的自動(dòng)駕駛就處于這個(gè)級(jí)別,目前頂多也只能算是2.5級(jí),如當(dāng)它要變道時(shí),你要打轉(zhuǎn)向燈告訴系統(tǒng),系統(tǒng)才能啟動(dòng)變道的功能。
Level 3
它與L2最大的區(qū)別是系統(tǒng)具備了一定的自我決策能力,它能在某些情況下實(shí)現(xiàn)完全的自動(dòng)駕駛,但是駕駛員仍要隨時(shí)準(zhǔn)備應(yīng)對(duì)接管車輛,不同的是系統(tǒng)會(huì)在失效前給司機(jī)提示和預(yù)留一定的時(shí)間,比如當(dāng)出現(xiàn)復(fù)雜環(huán)境系統(tǒng)無法響應(yīng)時(shí),它會(huì)做出反饋,可以預(yù)留十幾秒或者更長的時(shí)間等人來接管控制權(quán),并保證在這個(gè)時(shí)間內(nèi)不出問題。要注意領(lǐng)航和巡航是有很大差距的,L1、 L2只能實(shí)現(xiàn)巡航功能,就是跟著別的車后面走,到L3級(jí)別是可以實(shí)現(xiàn)領(lǐng)航了,就有了自主決策的能力,這個(gè)的技術(shù)難度和復(fù)雜度會(huì)增加很多。
2018年奧迪A8就達(dá)到了這個(gè)級(jí)別,它們稱為Audi AI 交通擁堵自動(dòng)駕駛系統(tǒng)TJP(Traffic Jam Pilot)在交通擁堵的路段可以啟動(dòng)自動(dòng)駕駛功能,駕駛員就可以完全不用管了,這個(gè)還是比較實(shí)用的,但在中國由于政策法規(guī)限制,這個(gè)功能現(xiàn)在無法用的,比如我們規(guī)定你的手不能長時(shí)離開方向盤。因?yàn)長evel 3時(shí)仍需要一個(gè)駕駛員,并且要根據(jù)系統(tǒng)提示接管對(duì)車輛的控制,但車在路況好的時(shí)候人長時(shí)間不用關(guān)注車的駕駛,所以司機(jī)更容易走神,此時(shí)忽然遇到一個(gè)復(fù)雜情況系統(tǒng)無法處理,而駕駛員此時(shí)可能也無法回過神來。所以有些公司或機(jī)構(gòu)在調(diào)研后認(rèn)為這個(gè)級(jí)別更不安全不靠譜,直接忽略此級(jí)別,直接上更高級(jí)別,比如Google的Waymo。而傳統(tǒng)的OEM和一級(jí)供應(yīng)商可能會(huì)一個(gè)級(jí)別一個(gè)級(jí)別的去實(shí)現(xiàn),不會(huì)采用相對(duì)激進(jìn)的方式,也可能因?yàn)槭袌?chǎng)策略不同。
Level 4
在這個(gè)級(jí)別已經(jīng)完全不需要人來參與了,但它是有限制的完全自動(dòng)駕駛,比如在某個(gè)園區(qū)或者公園的內(nèi)行駛,另外對(duì)速度等也有可能一定要求。百度和金龍客車合作的自動(dòng)駕駛巴士“阿波龍”就屬于這個(gè)級(jí)別,并且在車內(nèi)你看不到駕駛位,并且沒有了方向盤。它今年在很多地方都在試運(yùn)營,這個(gè)已然不是PPT,是實(shí)實(shí)在在的產(chǎn)品了。
Level 5
這個(gè)級(jí)別是無限制的自動(dòng)駕駛,可以理解為在一個(gè)城市內(nèi),或者城市間,在任何的復(fù)雜交通場(chǎng)景中,自動(dòng)系統(tǒng)都能夠勝任。這個(gè)級(jí)別是非常難以實(shí)現(xiàn)的。
自動(dòng)駕駛的技術(shù)
自動(dòng)駕駛是一個(gè)知識(shí)密集且科技含量很高的技術(shù),不基于點(diǎn)什么很難把它講的相對(duì)清楚。做自動(dòng)駕駛的公司也很多,而對(duì)于學(xué)習(xí)研究,百度的Apollo開源平臺(tái)是一個(gè)很好的選擇,我就根據(jù)這個(gè)平臺(tái),結(jié)合個(gè)人理解粗略地講下自動(dòng)駕駛所需技術(shù)。
無論詩和遠(yuǎn)方或是閑晃總會(huì)有一個(gè)目的,為了體驗(yàn)駕駛樂趣的閑晃這里不討論,對(duì)自動(dòng)駕駛而言,首先需要一個(gè)目的地。先告訴汽車讓它知道要去哪里,定位出自己在哪里,然后再解決如何去,如果這些都是由汽車自動(dòng)完成,就實(shí)現(xiàn)了高級(jí)別的自動(dòng)駕駛。
如下圖可以很好地解釋自動(dòng)駕駛的內(nèi)涵:
據(jù)此我們可大體猜測(cè)下要用到的技術(shù):
定位和規(guī)劃
要知道自己在哪兒,要有定位系統(tǒng),就要用到GPS, 對(duì)于要厘米級(jí)的定位需要RTK技術(shù),要用到IMU來互補(bǔ)GPS更新頻率慢的問題,還需要用到激光雷達(dá)點(diǎn)云匹配定位以解決長時(shí)間沒有GPS信號(hào)的問題,如能過山谷或隧道。我們所說的在哪是汽車要實(shí)時(shí)知道自己在高精度地圖的坐標(biāo),在這個(gè)前提下,再有了目的地就可以實(shí)時(shí)路徑規(guī)劃給出車輛行進(jìn)的大方向。
感知和預(yù)測(cè)
在行進(jìn)的過程中,車輛要實(shí)時(shí)感知PercepTIon周圍的環(huán)境,并實(shí)時(shí)預(yù)測(cè)PredicTIon下一步如何動(dòng)作,且有各種突發(fā)狀況,這一部分可能是整個(gè)自動(dòng)駕駛技術(shù)里最難的。要對(duì)目標(biāo)進(jìn)行Detection Classification,要Tracking,還涉及到傳感器的融合Fusions,需要用到各種技術(shù)如CNNs,Machine Learning等等。所需運(yùn)算量相當(dāng)大,所有自動(dòng)駕駛的CPU的運(yùn)算性能要求特別高,要用到GPU最好是AI芯片。
此處要用到各種傳感器組合使用,如Camera,LiDAR,Radar等,以實(shí)現(xiàn)冗余和高可靠性,具體原因參考下圖。
這個(gè)是業(yè)界比較主流的做法。
特斯拉(Tesla)老板不信這個(gè),堅(jiān)決不用激光雷達(dá),全球第一個(gè)自動(dòng)駕駛引發(fā)死亡的案件就由此產(chǎn)生了,當(dāng)時(shí)司機(jī)坐在Model S上,聽說是在看哈里·波特,我想可能是西游記,然后系統(tǒng)就把白色的卡車車箱當(dāng)作了空氣當(dāng)作了Nothing,全速撞了上去,司機(jī)直接和佛祖打牌去了。
控制
預(yù)測(cè)出汽車如何動(dòng)作,還需要平滑的控制汽車的制動(dòng),這時(shí)又涉及到自動(dòng)控制算法,對(duì)于自動(dòng)駕駛車輛有個(gè)要求是能夠線控的,比如剎車,油門,轉(zhuǎn)向等都是可以計(jì)算機(jī)發(fā)命令來控制的。
至此自動(dòng)駕駛所需技術(shù)定位,路徑規(guī)劃,感知,預(yù)測(cè),控制技術(shù)就簡單介紹完。另外我們注意到還有個(gè)聯(lián)網(wǎng)功能,常說的Telematics或T-Box,目前的4G因帶寬和延時(shí)還無法滿足自動(dòng)駕駛的要求,主要的功能是影音娛樂的功能,當(dāng)5G普及后可能實(shí)現(xiàn)車輛協(xié)同的自動(dòng)駕駛,比如超視距感知等功能。
自動(dòng)駕駛的意義
安全
最主要的原因是安全,因?yàn)楦鶕?jù)世界衛(wèi)生組織(World Health Organization)的調(diào)查統(tǒng)計(jì)數(shù)據(jù),全世界每年有超過125萬人死于車禍,而80%的原因是司機(jī)的人為因素。 人會(huì)有疲勞駕駛,注意力不集中,以及情緒問題,如路怒癥,另外還有可能酒駕,人的響應(yīng)速度也遠(yuǎn)沒有傳感器的響應(yīng)速度快。
另外其實(shí)我們?nèi)祟惖拇竽X的進(jìn)化還不是非常適應(yīng)現(xiàn)代社會(huì)形態(tài),工業(yè)社會(huì)只有兩百多年,汽車的出現(xiàn)也就一百多年的歷史,而我們?nèi)祟惔竽X底層是億萬年進(jìn)化的結(jié)果,大部分的時(shí)間又是處在狩獵和農(nóng)耕時(shí)期,所以當(dāng)我們看到一條蛇或者一些其它動(dòng)物會(huì)產(chǎn)生本能的恐懼,而面對(duì)危險(xiǎn)不知道多少倍的鋼鐵怪獸汽車卻無動(dòng)于衷,人類大腦其實(shí)可能遠(yuǎn)沒有進(jìn)化到符合現(xiàn)代社會(huì)的要求。所以人類自己開車可能并不是最安全的選擇,或許再過幾百年后有人駕駛汽車只會(huì)出現(xiàn)在汽車博物館里,那時(shí)的人們可以會(huì)摸著方向盤踩著油門對(duì)當(dāng)時(shí)居然是人類自己駕駛汽車這個(gè)危險(xiǎn)的東西而感到不可思議。
利益
安全是很重要,但對(duì)于各大公司來講這應(yīng)當(dāng)不是他們的驅(qū)動(dòng)力,真正驅(qū)動(dòng)他們投入巨大財(cái)力進(jìn)行駕駛駕駛研發(fā)的是因?yàn)槔娴淖非蠛涂释约皩?duì)錯(cuò)失這個(gè)市場(chǎng)的恐懼。資本都是逐利的,都在想著搶占這個(gè)很快到來的的萬億級(jí)的市場(chǎng)。據(jù)有研究報(bào)告顯示至2025年,自動(dòng)駕駛市場(chǎng)規(guī)模將會(huì)達(dá)到2000億至 1.9 萬億美元。
顛覆
當(dāng)然也有可能有人因?yàn)楦h(yuǎn)大的目標(biāo)比如改變世界,像喬布斯。
也有可能就是因?yàn)閻邸?/p>
自動(dòng)駕駛也確實(shí)可能成為一個(gè)顛覆性的技術(shù)。它可能會(huì)改變很多的行業(yè)甚至現(xiàn)在城市的格局。
自動(dòng)駕駛的挑戰(zhàn)
但是自動(dòng)駕駛會(huì)很順利的成為現(xiàn)實(shí)嗎,在我看來很難。我從兩個(gè)點(diǎn)簡單講一下:
莫拉維克悖論 (Moravec‘s paradox)
是說對(duì)于人工智能和機(jī)器人來講,人類所獨(dú)有的邏輯推理能力只需要非常少的計(jì)算能力就實(shí)現(xiàn),比如AlphGo,但是無意識(shí)的技能和對(duì)機(jī)器的控制卻需要極大的運(yùn)算能力和運(yùn)算量。
有機(jī)構(gòu)做過推算說,要讓完全自動(dòng)駕駛窮盡所有道路場(chǎng)景,需要100輛車,200年 7*24小時(shí)的訓(xùn)練,但這也不一定,可能會(huì)窮盡0.99可能的場(chǎng)景,但當(dāng)仍會(huì)有不可預(yù)測(cè)性出現(xiàn),那時(shí)計(jì)算機(jī)是束手無策的,遠(yuǎn)沒有人類直覺應(yīng)對(duì)保險(xiǎn)。
舉一個(gè)例子,一個(gè)人類的小孩從來沒見過貓,你只需要給他一只貓,告訴他這是“貓咪”,下一次,當(dāng)他見到不管什么顏色,什么樣子的貓,他都知道這是“貓咪”。電腦不一樣,就算你給它上百萬張貓的照片,各種顏色,各種姿勢(shì),各種角度,你拿一只貓擺在它的攝像頭面前,讓它看個(gè)一年…… 它仍然不理解貓是什么,不能準(zhǔn)確的判斷一個(gè)東西是否是貓。比如谷歌訓(xùn)練計(jì)算機(jī)識(shí)別貓,當(dāng)時(shí)Google研究人員利用一千臺(tái)電腦的1.6萬核處理器組建了一個(gè)機(jī)器學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。他們用從YouTube視頻中提取出的1000萬幅200x200縮略圖訓(xùn)練神經(jīng)網(wǎng)絡(luò)來認(rèn)識(shí)什么是貓。
人只需要一雙眼睛去感知周圍,然后靠感覺和經(jīng)驗(yàn)就可以把車開的很好,不像自動(dòng)駕駛,要用各種傳感器的組合。人的駕駛目前才是真正的End-to-End ,直覺駕駛。
現(xiàn)在的機(jī)器學(xué)習(xí)”(machine learning),“深度學(xué)習(xí)”(deep learning),人工智能”(AI)其實(shí)跟人腦的思維方式有本質(zhì)區(qū)別。
列車難題(Trolley Problem)
假設(shè)當(dāng)所有的技術(shù)難題因?yàn)橐恍┨觳虐愕臉?gòu)架或者無數(shù)工程師的日夜努力都解決了,自動(dòng)駕駛還很有可能遇見道德的審問,比如列車難題,這是一個(gè)很著名的哲學(xué)難題。
如圖中所示,當(dāng)一輛有軌車行駛過來,此時(shí)他的剎車失靈了,而速度非???,但他此時(shí)仍可以轉(zhuǎn)動(dòng)方向盤,當(dāng)它直行時(shí)會(huì)傷害到四個(gè)人,而轉(zhuǎn)彎的話會(huì)傷害到一個(gè)人,這列車要不要轉(zhuǎn)向呢,如果是你,你會(huì)怎么做呢?我想多數(shù)會(huì)選擇轉(zhuǎn)向殺死一個(gè)人來挽救四個(gè)人的生命。
此時(shí)我們?cè)趽Q個(gè)場(chǎng)景,假如列車無法轉(zhuǎn)向,只有直直的一條軌道,而在這之上有一個(gè)天橋,此時(shí)天橋上正好站著一個(gè)大胖子,他就站在軌道正上面,如果此時(shí)你把他推下去,可以正好卡在軌道中間讓列車停下來,犧牲了一個(gè)胖子來挽救四個(gè)人的生命,而此時(shí)你還會(huì)這樣做嗎?此時(shí)的選擇可能就困難的多了。哲學(xué)會(huì)引發(fā)我們的思考,當(dāng)你開始思考一些事情時(shí)你就再也無法停下來了,它會(huì)讓我們對(duì)周圍熟悉的事物感到陌生,一切仿佛都沒有改變,但此時(shí)一切都已經(jīng)不同了。
比如看過一個(gè)真實(shí)故事,在南京市的某路段,上班高峰的時(shí)段一輛出租車在正常行駛中,突然向路邊的路墩上撞了去,一下整個(gè)車就四腳朝天。原因是出租車司機(jī)王師傅在路上駕駛中,自己突然覺得眼圈發(fā)黑,身體不適要暈厥,這時(shí)路的一側(cè)有很多早上上班的行人,王師傅來不及過多的思考,果斷的把方向盤往另一側(cè)的路邊的石墩撞去,出租車整個(gè)的就翻了過來。
當(dāng)自動(dòng)駕駛系統(tǒng)遇到此類問題時(shí),它會(huì)優(yōu)先如何做了,是優(yōu)先保護(hù)車上的乘客還是外面的行人?
自動(dòng)駕駛將來可能會(huì)遇到越來越多這類的問題,它如何決策如何應(yīng)對(duì)將是一個(gè)很大的難題。
可以預(yù)見自動(dòng)駕駛面臨的挑戰(zhàn)遠(yuǎn)不止這些,但無論如何都不會(huì)阻止此技術(shù)前行,因人類前行的步伐永遠(yuǎn)不會(huì)停止,因此未來才有無限可能。