當(dāng)前位置:首頁 > 芯聞號 > 充電吧
[導(dǎo)讀]最近,在西雅圖舉辦的IEEE國際機器人與自動化大會(ICRA)上,與會者們見到一種新的安全設(shè)備,該設(shè)備十分難得一見,目前正由科技巨頭谷歌研發(fā)。Anelia Angelova是谷歌的一名高級研究員,從事計算機視覺和機器學(xué)習(xí)的研發(fā)

最近,在西雅圖舉辦的IEEE國際機器人與自動化大會(ICRA)上,與會者們見到一種新的安全設(shè)備,該設(shè)備十分難得一見,目前正由科技巨頭谷歌研發(fā)。Anelia Angelova是谷歌的一名高級研究員,從事計算機視覺和機器學(xué)習(xí)的研發(fā)工作。她展示了一種新的行人檢測系統(tǒng),該系統(tǒng)可單獨處理視頻影像。

對于任何無人駕駛汽車來說,能識別,追蹤和躲避行人是一項十分重要的功能。谷歌的車輛上就裝滿了激光雷達,無線電探測器和攝像機,以確保他們能夠確定在數(shù)百米范圍內(nèi)的行人情況。

但一套感應(yīng)器十分昂貴,光車頂上的一個旋轉(zhuǎn)激光雷達裝置就要花費將近10000美元(如果是多功能裝置則花費得更多)。雷鋒網(wǎng)此前也專門分解過無人駕駛汽車的成本。如果自動汽車僅使用廉價的攝像機就能定位行人的話,這將大大降低成本,并且將有希望很快迎來一個機器自由操控汽車的時代。但攝像機有他們自己的問題。Angelova說到,“相較于雷達裝置,視覺信息給你一個更廣闊的視野,但處理速度卻相對較慢。”

至少它曾經(jīng)是這樣的。最好的視頻分析系統(tǒng)使用的是深層神經(jīng)網(wǎng)絡(luò),這種機器學(xué)習(xí)算法可以被訓(xùn)練,從而能對圖像信息(和其他類型的數(shù)據(jù))進行十分準(zhǔn)確的分類。深層神經(jīng)網(wǎng)絡(luò)依靠多個處理層,這些處理層位于輸入層和輸出層之間。為了進行圖像識別,輸入層會學(xué)習(xí)圖像的像素特征,下一層則要學(xué)習(xí)這些功能的組合,并通過中間層,逐漸形成更加精密復(fù)雜的關(guān)系。輸出層則負責(zé)推測系統(tǒng)在關(guān)注些什么。

現(xiàn)代深層網(wǎng)絡(luò)可以在諸如人臉識別等任務(wù)方面勝人一籌,準(zhǔn)確率超過99.5%。但Angelova解釋道,傳統(tǒng)的用于行人檢測的深層網(wǎng)絡(luò)速度很慢,它將每個街道圖像劃分為100000個甚至更多的小碎片,然后反過來對每個碎片進行分析。這可能需要幾秒鐘甚至幾分鐘每幀,使他們無法用于城市街道的巡視。使用這種網(wǎng)絡(luò)的汽車無法對行人進行及時的探測,可能在它發(fā)現(xiàn)行人的時候就已經(jīng)超了過去。

Angelova的新型高速行人檢測器分為三個單獨的階段。

-第一階段是一種深層網(wǎng)絡(luò),相較于之前的成千上萬的碎片而言,它只需將圖像信息分割成幾十塊碎片,可在多個地點同時進行多項檢測,從而對行人進行識別。

-第二個階段則是另一種網(wǎng)絡(luò),它能對識別結(jié)果進行改良。

-第三階段則是一種傳統(tǒng)的深層網(wǎng)絡(luò),它將最終識別結(jié)果,即是否發(fā)現(xiàn)行人,進行傳送。

由于這種緩慢準(zhǔn)確的網(wǎng)絡(luò)只對潛在圖像的一小部分進行分析,所以整個處理過程就會進行得更快,大約要比之前的網(wǎng)絡(luò)快60到100倍。Angelova說道,這些圖形處理器的運行和谷歌的無人駕駛汽車十分類似,會對大約一天以內(nèi)的街道圖像進行反饋。然后,它可以在大約0.25秒左右的時間準(zhǔn)確地識別行人。研究人員使用已知的行人圖像數(shù)據(jù)庫,而不是使用谷歌汽車的視頻,因為這樣他們可以將該結(jié)果同之前的網(wǎng)絡(luò)進行比較。

Angelova承認(rèn):“事實上,目前還達不到能用于實際的0.07秒。”為了能安全采取行動,無人駕駛汽車需要在瞬間確認(rèn)是否面對行人。“但這意味著倘若其他感應(yīng)器失靈,新系統(tǒng)能做出及時的補充處理。”

隨著更強大的處理器的出現(xiàn)以及神經(jīng)網(wǎng)絡(luò)容量的增加,Angelova預(yù)計該功能的效果將會顯著提升。她說:“從更加廣闊的視角來看待網(wǎng)絡(luò),你將能感受到更加快速的發(fā)展。”等到大家都能擁有無人駕駛汽車時,其獨特的旋轉(zhuǎn)激光雷達可能已經(jīng)完全消失了。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉