只用攝像頭也能實(shí)現(xiàn)無人駕駛?
無人駕駛汽車是通過車載傳感系統(tǒng)感知道路環(huán)境,自動規(guī)劃行車路線并控制車輛達(dá)到預(yù)定目標(biāo)的智能汽車。它利用車載傳感器來感知車輛周圍環(huán)境,并根據(jù)感知所獲得的道路、車輛位置和障礙物信息,控制車輛的轉(zhuǎn)向和速度,從而使車輛能夠安全、可靠地在道路上行駛。
無人駕駛汽車上主要的傳感器:激光雷達(dá)、攝像、毫米波雷達(dá)、GPS、超聲波雷達(dá)和車輪轉(zhuǎn)角傳感器等。ElonMusk曾經(jīng)在公開場合多次說過,不用激光雷達(dá)只用攝像頭,也能實(shí)現(xiàn)Level4以上的無人駕駛。但是我個(gè)人覺得他這么說其實(shí)是有商業(yè)化方面的考慮。
特斯拉的汽車已經(jīng)在售,賣出去的車只能更新軟件,肯定不能換硬件,比如全部重新裝上激光雷達(dá)(不然今天特斯拉也不會說現(xiàn)在在產(chǎn)的特斯拉汽車會換上新的硬件系統(tǒng))。
況且,Google無人車用的64線Velodyne激光雷達(dá)本身的價(jià)格高達(dá)75000美元,這幾乎和低配版特斯拉在美國的售價(jià)差不多了。
特斯拉的車要賣的好必須控制成本,Google的無人車目前還只是處于測試階段,幾百輛的規(guī)模當(dāng)然可以什么好用用什么,相比于特斯拉幾萬的產(chǎn)銷量,花不了多少錢。
今年5月7日,美國佛羅里達(dá)州的一位特斯拉車主在使用Autopilot時(shí)發(fā)生車禍,最終不幸生亡。由此還導(dǎo)致給特斯拉提供計(jì)算機(jī)視覺技術(shù)的Mobileye創(chuàng)始人AmnonShashua與ElonMusk之間的口水戰(zhàn),雙方最終還鬧掰了:Mobileye宣布在與特斯拉合同結(jié)束后不再繼續(xù)合作。
在特斯拉9月11日發(fā)布的Autopilot8.0版本中,特斯拉把毫米波雷達(dá)采集到的數(shù)據(jù)作為了控制系統(tǒng)判斷的主要依據(jù),而不是之前Mobileye的攝像頭。
說起5月份的車禍,其實(shí)在車禍發(fā)生前,特斯拉的毫米波雷達(dá)已經(jīng)感知到有障礙物,但是攝像頭因光線的問題,沒有發(fā)現(xiàn)在藍(lán)天白云背景下的大貨車,最后導(dǎo)致車禍發(fā)生。Musk肯定也知道了攝像頭并不靠譜,所以才在Autopilot的新版本中把毫米波雷達(dá)的數(shù)據(jù)作為主要參考依據(jù)。
綜上所述,Musk說「不用激光雷達(dá)只用攝像頭,也能實(shí)現(xiàn)Level4以上的無人駕駛」更多是出于商業(yè)化方面的考慮。
此舉意在一邊用現(xiàn)有的傳感器收集數(shù)據(jù),一邊等激光雷達(dá)價(jià)格降下來。個(gè)人認(rèn)為,如果固態(tài)激光雷達(dá)的價(jià)格真能如宣傳中所說下降到100美元到200美元,為了保證汽車行駛的安全性,Musk肯定是會用的。
一方認(rèn)為:數(shù)據(jù)為王,再牛的智能算法也拼不過海量的數(shù)據(jù)。而另一方則認(rèn)為:數(shù)據(jù)只是建材,強(qiáng)大的分析能力才能讓它變成摩天大樓,對效率的追求導(dǎo)致了算法,大數(shù)據(jù)取代不了算法。
日前,Google和特斯拉都公布了各自的測試?yán)锍虜?shù)。據(jù)外媒報(bào)道,Google宣布自己的無人駕駛汽車剛剛完成200萬英里道路行駛里程。而特斯拉創(chuàng)始人ElonMusk也于幾天后在個(gè)人Twitter上宣布:特斯拉Autopilot發(fā)布后的1年中累計(jì)行駛里程已達(dá)到2.22億英里。
Google和特斯拉兩方的表態(tài)表面上似乎也印證了微博討論中雙方的觀點(diǎn):數(shù)據(jù)為王VS算法為王。那實(shí)際情況究竟如何?
我們不妨考慮另一個(gè)類似的現(xiàn)象:大多數(shù)人認(rèn)為Google的搜索比微軟的Bing搜索在質(zhì)量上做得略好一點(diǎn)的原因是Google的算法好。
但在前Google工程師吳軍博士看來,這種看法在2010年之前是對的,因?yàn)槟菚r(shí)Bing在技術(shù)和工程方面明顯落后于Google。但今天這兩家公司在技術(shù)上已經(jīng)相差無幾了,Google還能稍稍占優(yōu),很大程度上靠的是數(shù)據(jù)的力量。
與搜索算法尚不成熟的2000年不同,今天已經(jīng)不存在一個(gè)未知的方法,僅憑它就能將準(zhǔn)確率提高哪怕一個(gè)百分點(diǎn)。Google憑借PageRank算法給搜索結(jié)果帶來了質(zhì)的變化,而好的搜索結(jié)果能吸引更多的用戶使用Google的搜索引擎,這不知不覺間給Google提供了大量的點(diǎn)擊數(shù)據(jù)。有了這些數(shù)據(jù)之后,Google可以訓(xùn)練出更精確的“點(diǎn)擊模型”,而點(diǎn)擊模型貢獻(xiàn)了今天搜索排序至少60%到80%的權(quán)重,這將吸引更多的用戶,整個(gè)過程是一個(gè)典型的不斷自我強(qiáng)化的正反饋過程。
在Google內(nèi)部,產(chǎn)品經(jīng)理們都遵循這樣一個(gè)規(guī)則:在沒有數(shù)據(jù)之前,不要給出任何結(jié)論。由此可見,Google的企業(yè)使命已經(jīng)融入了員工的日常工作中。Google正是充分利用了大數(shù)據(jù)的力量,順利成為了對整張互聯(lián)網(wǎng)舉足輕重的樞紐節(jié)點(diǎn),非常自然地實(shí)現(xiàn)了對互聯(lián)網(wǎng)的壟斷。
再舉一個(gè)例子,9月27日Google發(fā)布了新版本的神經(jīng)機(jī)器翻譯系統(tǒng)(GoogleNeuralMachineTranslation,GNMT),宣稱該系統(tǒng)的翻譯質(zhì)量接近人工筆譯
大多數(shù)網(wǎng)友在實(shí)際測試過后,表示眼前一亮。與此同時(shí),這也引起了某些翻譯工作者的恐慌:「作為翻譯看到這個(gè)新聞的時(shí)候,我理解了18世紀(jì)紡織工人看到蒸汽機(jī)時(shí)的憂慮與恐懼?!苟@其實(shí)也是充分利用大數(shù)據(jù)的結(jié)果。
其實(shí)早在2005年,Google的機(jī)器翻譯質(zhì)量就讓全世界從事自然語言處理的人震驚不已了:從來沒有從事過機(jī)器翻譯的Google,在美國國家標(biāo)準(zhǔn)技術(shù)研究所(NationalInstituteofStandardsandTechnology,NIST)的年度測評中遙遙領(lǐng)先。
在阿拉伯語到英語翻譯的封閉測試集中,Google系統(tǒng)的BLUE評分為51.31%,領(lǐng)先第二名將近5%,而提高這5個(gè)百分點(diǎn)在過去需要研究5到10年。
Google究竟是做到的呢?除了Google一貫的行事風(fēng)格——把該領(lǐng)域全世界最好的專家、南加州大學(xué)ISI實(shí)驗(yàn)室的弗朗茲-奧科(FranzOch)博士挖過來之外,最關(guān)鍵的還是Google手里握有改進(jìn)機(jī)器翻譯系統(tǒng)所需要的大數(shù)據(jù)。
從奧科2004年加入Google到2005年參加NIST測試,期間只有一年時(shí)間,如此短的時(shí)間只夠他將在南加大的系統(tǒng)用Google的程序風(fēng)格重新實(shí)現(xiàn)一遍,完全沒有額外的時(shí)間做新的研究。而從上圖中我們可以看到,Google和南加大系統(tǒng)的水平差了5到10年。
其中的秘密就在于:奧科在Google還是用的在南加大使用過的方法,但充分利用了Google在數(shù)據(jù)收集和處理方面的優(yōu)勢,使用了比其他研究機(jī)構(gòu)多上萬倍的數(shù)據(jù),訓(xùn)練出一個(gè)機(jī)器翻譯的六元模型(一般來講N元模型的N值不超過3)。當(dāng)奧科使用的數(shù)據(jù)是其他人的上萬倍時(shí),量變的積累導(dǎo)致了質(zhì)變的發(fā)生,而這就是當(dāng)今人工智能領(lǐng)域最權(quán)威的幾位專家之一杰弗里-辛頓(GeoffreyHinton)教授所堅(jiān)持的“多則不同”吧。
值得一提的是,SYSTRAN公司是一家使用語法規(guī)則進(jìn)行翻譯的企業(yè),在科學(xué)家們還沒有想到或者有條件利用統(tǒng)計(jì)的方法進(jìn)行機(jī)器翻譯之前,該企業(yè)在機(jī)器翻譯領(lǐng)域是最領(lǐng)先的。但現(xiàn)在與那些采用了數(shù)據(jù)驅(qū)動的統(tǒng)計(jì)模型的翻譯系統(tǒng)相比,它的翻譯系統(tǒng)就顯得非常落后了。
經(jīng)過上述分析,對本小結(jié)的問題終于可以下一個(gè)較安全的結(jié)論:在當(dāng)下的企業(yè)競爭中,相比于算法或數(shù)學(xué)模型,數(shù)據(jù)的重要性的確要大得多,即數(shù)據(jù)為王。
因?yàn)榍罢咄蓪W(xué)術(shù)界在幾十年前就已經(jīng)發(fā)現(xiàn)了,所有企業(yè)都可以加以利用,但是多維度的完備數(shù)據(jù)并不是每一個(gè)企業(yè)都擁有的。
今天很多企業(yè)在產(chǎn)品和服務(wù)的競爭,某種程度上已經(jīng)是數(shù)據(jù)的競爭了,可以說沒有數(shù)據(jù)就沒有智能。因?yàn)閺睦碚撋现v,只要能夠找到足夠多的具有代表性的數(shù)據(jù),就可以利用概率統(tǒng)計(jì)結(jié)果找到一個(gè)數(shù)學(xué)模型,使得它和真實(shí)情況非常接近,從而節(jié)省了大量人力成本或給予了用戶更愉悅的體驗(yàn)。
總結(jié)
特斯拉已經(jīng)積累的2.22億英里行駛數(shù)據(jù),以及未來將要積累的數(shù)據(jù),對于他們研發(fā)Level4以上的無人駕駛汽車是非常有幫助的,特斯拉可能會最終會先Google一步實(shí)現(xiàn)量產(chǎn)。
目前出于商業(yè)化的考慮,已量產(chǎn)的特斯拉用“攝像頭毫米波雷達(dá)超聲波雷達(dá)”作為主要傳感器,但是等到低成本的固態(tài)激光雷達(dá)性能更穩(wěn)妥。我相信Musk肯定是會裝上去的(有網(wǎng)友已經(jīng)在加州的道路上拍到頭上頂著激光雷達(dá)的特斯拉汽車偷偷在做測試了),因?yàn)檫@對于保證實(shí)現(xiàn)99.9999%的車輛行駛安全性是非常有幫助的。