當(dāng)前位置:首頁 > 汽車電子 > 汽車電子技術(shù)文庫
[導(dǎo)讀] 與人類用雙眼去觀察路面、用手去操控方向盤類似,無人車用一排攝像機(jī)去感知環(huán)境,用深度學(xué)習(xí)模型指導(dǎo)駕駛。大體來說,這個過程分為五步: 記錄環(huán)境數(shù)據(jù) 分析并處理數(shù)據(jù) 構(gòu)建理解環(huán)

與人類用雙眼去觀察路面、用手去操控方向盤類似,無人車用一排攝像機(jī)去感知環(huán)境,用深度學(xué)習(xí)模型指導(dǎo)駕駛。大體來說,這個過程分為五步:

記錄環(huán)境數(shù)據(jù)

分析并處理數(shù)據(jù)

構(gòu)建理解環(huán)境的模型

訓(xùn)練模型

精煉出可以隨時間改進(jìn)的模型

如果你想了解無人車的原理,那這篇文章不容錯過。

記錄環(huán)境數(shù)據(jù)

一輛無人車首先需要具備記錄環(huán)境數(shù)據(jù)的能力。

具體來說,我們的目標(biāo)是得到左右轉(zhuǎn)向角度的均勻分布。這倒也不難操作,可以以順時針和逆時針方向在測試場地內(nèi)繞圈的方式實(shí)現(xiàn)。這種訓(xùn)練有助于減少轉(zhuǎn)向偏差,避免長時間駕駛后汽車從道路一邊慢慢漂移到道路另一邊的尷尬情境。

此外,以慢速(例如每小時10英里)行駛也有助于在轉(zhuǎn)彎時記錄平滑的轉(zhuǎn)向角,在這里駕駛行為被分類為:

直線行駛:0<=X<0.2

小轉(zhuǎn)彎:0.2<=X<0.4

急轉(zhuǎn):X>=0.4

恢復(fù)到中心

其中,X為轉(zhuǎn)向角,r為旋轉(zhuǎn)半徑(單位為米),計算轉(zhuǎn)向角的公式為X=1/r。上面提到的“恢復(fù)到中心”在數(shù)據(jù)記錄過程中很重要,它幫助車輛學(xué)會在即將撞上,馬路崖子時回到車道中心。這些記錄數(shù)據(jù)保存在driving_log.csv中,其中每一行都包含:

文件路徑到鏡頭前中央相機(jī)圖像

文件路徑到前左相機(jī)圖像

文件路徑到前右相機(jī)圖像

轉(zhuǎn)向角

在記錄環(huán)境數(shù)據(jù)的過程中,我們需要記錄約100000個轉(zhuǎn)向角的圖像,以便提供足夠的數(shù)據(jù)訓(xùn)練模型,避免因樣本數(shù)據(jù)不足導(dǎo)致的過擬合。通過在數(shù)據(jù)記錄過程中定期繪制轉(zhuǎn)向角直方圖,可以檢查轉(zhuǎn)向角是否為對稱分布。

分析處理數(shù)據(jù)

第二步是為構(gòu)建模型分析和準(zhǔn)備剛剛記錄的數(shù)據(jù),此時的目標(biāo)是為模型生成更多的訓(xùn)練樣本。

下面這張圖片由前中央相機(jī)拍攝,分辨率為320*160像素,包含紅色、綠色和藍(lán)色的channel。在Python中,可以將其表示為一個三維數(shù)組,其中每個像素值的范圍在0到255之間。

司機(jī)視線以下的區(qū)域和兩邊的車道標(biāo)志一直是自動駕駛技術(shù)中研究的重點(diǎn)。這兩部分可以使用Keras中的Cropping2D裁剪圖像,減少輸入到模型中的噪聲。

我們可以用開源的計算機(jī)視覺庫OpenCV從文件中讀取圖像,然后沿垂直軸翻轉(zhuǎn),生成一個新的樣本。

OpenCV非常適合自動駕駛汽車用例,因為它是用C++語言編寫的。像傾斜和旋轉(zhuǎn)這樣的其他圖像增強(qiáng)技術(shù),也有助于產(chǎn)生更多的訓(xùn)練樣本。

此外,還需要通過乘以-1.0翻轉(zhuǎn)其轉(zhuǎn)向角。

之后,可以用Numpy開源庫將圖像重新塑造成一個三維數(shù)組,方便下一步的建模。

構(gòu)建理解環(huán)境的模型

圖像數(shù)據(jù)搞定后,我們需要為無人車構(gòu)建理解環(huán)境信息的深度學(xué)習(xí)模型,從記錄的圖像中提取特征。

具體來說,我們的目標(biāo)是將包含153600像素的輸入圖像映射到包含單個浮點(diǎn)值的輸出。英偉達(dá)之前提出的模型的每一層都提供了特定的功能,作為基礎(chǔ)架構(gòu)效果應(yīng)該不錯。

英偉達(dá)模型相關(guān)論文地址:https://arxiv.org/pdf/1604.07316v1.pdf

之后,我們需要將三維數(shù)組規(guī)范化為單位長度,防止模型中較大的值偏差。注意我們將其除以255.0,因為這是一個像素的最大可能值。

還要適當(dāng)減少人類視野以下的車前場景和車前上方圖像的像素,以減少噪音。

之后,我們需要將車道標(biāo)記等三維數(shù)組進(jìn)行卷積,提取關(guān)鍵特征,這些信息對于預(yù)測轉(zhuǎn)向角至關(guān)重要。

我們想讓開發(fā)的模型能夠駕馭任何道路類型,因此需要用dropout減少過擬合。

最后,我們需要將轉(zhuǎn)向角輸出為float。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉