上海工廠是特斯拉全球計劃的部分 意在適應中國路況的自動駕駛功能優(yōu)化
12月30日,位于上海的特斯拉工廠將開始交付Model 3。意味著,這家工廠將在開工357天后開始向客戶交付汽車,這將創(chuàng)下全球汽車制造商在華的新紀錄。
上海工廠是特斯拉全球計劃的一部分,目的是增強其在世界最大汽車市場的影響力,更重要的是本地化的工程研發(fā)團隊也即將落地,目的之一就是適應中國路況的自動駕駛功能優(yōu)化。
目前,特斯拉在國內的Autopilot版本更新一直落后于美國市場。而在今年9月,交通運輸部部長李小鵬會見特斯拉CEO馬斯克時,雙方就自動駕駛技術發(fā)展交換了意見。顯然,特斯拉在過去一年時間,已經(jīng)頻繁與中國的相關主管部門進行各種溝通,這在過去是不常見的。
彼時,交通運輸部特別強調了歡迎包括特斯拉在內的各國新能源汽車制造商、自動駕駛研發(fā)機構和企業(yè)與中國科研單位、企業(yè)加強技術交流和研發(fā)合作,不斷拓展合作范圍,共同推動自動駕駛技術落地。
而馬斯克表示,特斯拉愿與中方一道努力,持續(xù)加強在自動駕駛技術研發(fā)、標準制定等方面的交流與合作,期待得到中國交通運輸部的更多支持。
與此同時,最快于明年部署全自動駕駛系統(tǒng)的特斯拉,正在陸續(xù)披露一系列和自動駕駛功能相關的技術細節(jié)。
一、全自動駕駛底層技術陸續(xù)曝光
這其中,近日披露的一個專利對于其全球化部署意味深重。這個名為數(shù)據(jù)管道(data pipeline)和深度學習系統(tǒng)的專利,優(yōu)化了用于深度學習的圖像處理過程,除了車端深度學習的流程優(yōu)化之外,還特別提到了未來如何在全球市場共享數(shù)據(jù)。
按照專利的描述,從單一車輛上提取的圖像數(shù)據(jù)信息將與其他特斯拉用戶在全球范圍內收集的數(shù)據(jù)進行比較,一方面緩解駕駛員在自動駕駛時系統(tǒng)可能執(zhí)行錯誤過程的擔憂,同時在特斯拉自動駕駛軟件穩(wěn)定版本的性能基礎上加以改進,而且改進的過程比以前更有效率。
“通過這個過程,特斯拉能夠從車輛的攝像頭和傳感器捕捉的圖像中保持盡可能高的分辨率。這樣,神經(jīng)網(wǎng)絡就可以更有效地從它所接收的數(shù)據(jù)包中學習。這使得神經(jīng)網(wǎng)絡能夠以更有效的方式處理更好的圖像,從而為更快地改進自動駕駛技術打開了大門?!?/p>
而特斯拉的新數(shù)據(jù)管道和深度學習專利為更快的自動駕駛改進鋪平了道路。這項新專利,意味著特斯拉的數(shù)據(jù)傳輸管道可能是業(yè)內最大的之一,因為它從數(shù)十萬輛配備了大量傳感器的汽車中提取數(shù)據(jù)。
在應用中,特斯拉解釋了其系統(tǒng)正在解決的問題:
用于實現(xiàn)自動駕駛的深度學習系統(tǒng)通常依靠捕獲的傳感器數(shù)據(jù)作為輸入。在傳統(tǒng)的學習系統(tǒng)中,通過將捕獲的傳感器數(shù)據(jù)從傳感器格式轉換為與學習系統(tǒng)的初始輸入層兼容的格式,使捕獲的傳感器數(shù)據(jù)與深度學習系統(tǒng)兼容。
這種轉換可能包括壓縮和下采樣,從而降低原始傳感器數(shù)據(jù)的信號保真度。此外,更換傳感器可能需要一個新的轉換過程。因此,需要一種定制的數(shù)據(jù)管道,可以最大限度地從捕獲的傳感器數(shù)據(jù)中獲取信號信息,為深度學習網(wǎng)絡提供更高層次的信號信息,進行深度學習分析。
特斯拉在專利申請中描述了它的解決方案:
本發(fā)明公開了一種數(shù)據(jù)管道,該數(shù)據(jù)管道將傳感器數(shù)據(jù)作為獨立組件提取并提供給用于自動駕駛的深度學習網(wǎng)絡。在一些實施例中,使用深度學習網(wǎng)絡和從傳感器接收的輸入數(shù)據(jù)實現(xiàn)自動駕駛。
例如,安裝在車輛上的傳感器將車輛周圍環(huán)境的實時傳感器數(shù)據(jù)(如視覺、雷達和超聲波數(shù)據(jù))提供給神經(jīng)網(wǎng)絡,用于確定車輛控制響應。
在一些實施例中,網(wǎng)絡使用多層實現(xiàn)。根據(jù)傳感器數(shù)據(jù)的信號信息,將傳感器數(shù)據(jù)提取為兩個或多個不同的數(shù)據(jù)組件。例如,特征或邊緣數(shù)據(jù)可以從全局數(shù)據(jù)中分離出來,提取到不同的數(shù)據(jù)組件中。
而不同的數(shù)據(jù)組件保留了目標相關的數(shù)據(jù),例如,數(shù)據(jù)最終會被深度學習網(wǎng)絡用來識別邊緣和其他特征。在一些實施例中,不同的數(shù)據(jù)組件作為存儲與識別特定目標功能高度相關的數(shù)據(jù)的容器,但它們本身并不識別或檢測功能。
不同的數(shù)據(jù)組件提取數(shù)據(jù),以確保在機器學習網(wǎng)絡的適當階段進行準確的特征檢測。在某些實施例中,可以對不同的數(shù)據(jù)組件進行預處理,以增強其包含的特定信號信息。可以對數(shù)據(jù)組件進行壓縮或下采樣,以提高資源和計算效率。然后在系統(tǒng)的不同層將不同的數(shù)據(jù)組件提供給深度學習系統(tǒng)。
深度學習網(wǎng)絡能夠利用提取過程中保留的信號信息作為輸入,準確地識別和檢測與數(shù)據(jù)組件的目標數(shù)據(jù)(如邊緣、對象等)相關的特征。
例如,將特征和邊緣數(shù)據(jù)提供給網(wǎng)絡的第一層,將全局光照數(shù)據(jù)提供給網(wǎng)絡的后一層。通過提取不同的數(shù)據(jù)組件,每個組件保留各自的目標信號信息,網(wǎng)絡可以更有效地處理傳感器數(shù)據(jù)。
同時,不再接收傳感器數(shù)據(jù)作為網(wǎng)絡的初始輸入,而是在網(wǎng)絡的最適當層向網(wǎng)絡提供最有用的信息。在一些實施例中,由于不同的數(shù)據(jù)組件可以充分利用其各自組件的圖像分辨率來實現(xiàn)其預期目的,因此網(wǎng)絡將分析捕獲的傳感器數(shù)據(jù)的更完整版本。
例如,特征和邊緣的輸入可以利用特征和邊緣數(shù)據(jù)的整個分辨率、位范圍和位深度,而全局光照的輸入可以利用全局光照數(shù)據(jù)的整個分辨率、位范圍和位深度。
有趣的是,專利中列出的三位工程師中的兩位已經(jīng)不在特斯拉工作了。至于剩下這位工程師是否還在特斯拉尚不清楚。這至少說明此項專利已經(jīng)在內部應用較長時間。
二、實際行駛數(shù)據(jù)+深度學習+OTA
一直以來,特斯拉的神經(jīng)網(wǎng)絡接受大量真實數(shù)據(jù)的訓練,這些數(shù)據(jù)是從用戶實際行駛收集來的。目前,所有的特斯拉車型都配備了某種版本的Autopilot,累計總共行駛了大約20億英里。
當特斯拉為Autopilot添加一個新功能時,它首先會向一小群“early access”用戶進行部署。從他們的車中記錄的數(shù)據(jù)然后被用來完善功能,隨后用戶群被擴大,然后更多的完善。一開始看起來粗糙和不可靠的新功能可以在幾周內改變。
更讓人驚訝的是,在今年彭博社的一次用戶調查中,特斯拉車主在很大程度上支持馬斯克的做法,即使自動駕駛偶爾會出問題。
以最新發(fā)布的智能召喚(也可以理解為L4的自主泊車)為例,盡管網(wǎng)絡上不少功能出故障的視頻,但調查結果顯示,高達70%的車主認可該功能。不過,一些安全倡導者批評特斯拉把客戶當作實驗品。
馬斯克表示,現(xiàn)實世界的訓練(提升自動駕駛功能)是減少車禍的最快途徑,也可能是唯一途徑。至少對于智能召喚來說,錯誤發(fā)生在停車場(低速),并且不太可能造成嚴重的傷害。
智能召喚是特斯拉實現(xiàn)自動駕駛的高頻場景之一,停車場對自動駕駛來說是出了名的難。一方面,不在道路法規(guī)管轄范圍內;另一方面,不同停車場的標記線、行駛路線不規(guī)則以及車流、人流混雜。
智能召喚需要對人類行為有深刻的理解。在智能召喚發(fā)布后的第一個月里,特斯拉車主們使用了100多萬次。馬斯克表示,這將有助于“讓我們能夠檢查這些角落里的情況,并從中進行快速學習”。
看看用戶的真實評論,或許你更能明白其中的道理。
“雖然這款軟件目前還處于測試階段,但在駕駛員的監(jiān)督下使用已經(jīng)足夠了。這是完全自動駕駛的先驅,隨著時間的推移,它會變得更加可靠,就像Autopilot一樣。”盡管我們經(jīng)常會在網(wǎng)絡上看到一些車主對功能的濫用,但實際上大多是特斯拉車主仍然非常謹慎使用,并且期待功能的不斷完善。
作為軟件定義汽車最典型的代表,自動駕駛的真正商業(yè)化,應該是在車企、用戶及系統(tǒng)之間形成一個真正的閉環(huán),從而基于真正有效的數(shù)據(jù)來反哺系統(tǒng)的不斷自我學習。
這或許也能解釋,為什么今年特斯拉收購了計算機視覺初創(chuàng)公司DeepScale。后者有一項名為SqueezeNet的解決方案,可以實現(xiàn)深度神經(jīng)網(wǎng)絡在更小的設備上工作,并且允許以超高效的方式處理大量數(shù)據(jù)。
這在全自動駕駛時代尤其重要,因為系統(tǒng)從車輛的多傳感器中收集了大量數(shù)據(jù)。特斯拉基于自主研發(fā)的FSD芯片,基于DeepScale的技術幫助更好地優(yōu)化硬件、數(shù)據(jù)處理和深度學習,而無線更新(OTA)則是一個高效的解決方案為系統(tǒng)不斷迭代提供助力。
然而,今天典型的CNN/DNN模型的空中更新需要大量的數(shù)據(jù)傳輸。DeepScale的另一項核心技術就是保證更小的模型需要更少的通信,使得頻繁的更新更加可行。
這包括較小的卷積神經(jīng)網(wǎng)絡(CNNs)在分布式訓練中需要較少的服務器間通信;更小的CNNs需要更少的帶寬將新模型從云端導出到自動駕駛汽車上;較小的CNNs更適合部署在內存有限的FPGAs和其他硬件上。
使用SqueezeNet,可以實現(xiàn)與AlexNet相比模型尺寸減少50倍,同時達到或超過了AlexNet的top 1和top 5的精度。模型的縮減量遠高于SVD、網(wǎng)絡裁剪和深度壓縮。
同時,應用8位量化的深度壓縮,SqueezeNet得到一個0.66MB的模型(比32位的AlexNet小363×),與AlexNet的精度相當。此外,在SqueezeNet上采用6位量化和33%稀疏的深度壓縮,可以得到一個0.47MB的模型(比32位AlexNet小510×),并且具有同等的精度。
有趣的是,DeepScale的第一款產(chǎn)品是一款名為Carver21的感知軟件,專門用來優(yōu)化自動駕駛汽車前置攝像頭的數(shù)據(jù)處理。這與一直堅持視覺優(yōu)先的特斯拉非常匹配,同時其也擁有道路上最大的聯(lián)網(wǎng)車隊,大量的真實數(shù)據(jù)對于DeepScale也是最佳的實踐。
這就是DeepScale的SqueezeNet發(fā)揮作用的地方。由于其精確度與最先進的神經(jīng)網(wǎng)絡相匹配,因此能夠對神經(jīng)網(wǎng)絡進行有效的訓練,并保證神經(jīng)網(wǎng)絡模型的最小化,并且保證硬件上的可用資源進行速度-精度的權衡。
DeepScale的全棧深度學習方法使人工智能軟件與各種處理器和傳感器緊密集成,實現(xiàn)可定制的自動駕駛功能。模塊負責從訓練、開發(fā)、部署,甚至數(shù)據(jù)收集/管理的每一個方面。
實時決策對任何無人駕駛汽車都至關重要。能夠在集中式的高計算環(huán)境中部署更多具有更高精度的深度學習功能是任何自動駕駛汽車制造商所希望的。而且,在這么小的計算空間里部署多個DNN正是DeepScale的解決方案非常適合特斯拉的原因。
而隨著特斯拉的車隊(搭載Autopilot)增加到100萬輛,它的月行駛里程將達到10億英里左右(相當于之前一年的數(shù)據(jù)),比Waymo的月行駛里程約100萬英里高出1000倍。這意味著特斯拉具有從0.001%的里程中收集大量邊緣訓練樣本的機會。