當前位置:首頁 > 智能硬件 > 人工智能AI
[導讀] 為了進一步推動ReID的技術(shù)突破和落地應用,10月22日啟動的首屆“全國人工智能大賽”專門設置了“行人重識別(Person ReID)”賽項,面向全國廣泛征集來自高校、企業(yè)、科研單位等的團隊和個

為了進一步推動ReID的技術(shù)突破和落地應用,10月22日啟動的首屆“全國人工智能大賽”專門設置了“行人重識別(Person ReID)”賽項,面向全國廣泛征集來自高校、企業(yè)、科研單位等的團隊和個人參賽。

作者 | 劉偉

談到人工智能,大眾最耳熟能詳?shù)漠攲?u>人臉識別技術(shù),它已經(jīng)滲透到了我們生活的方方面面。但在計算機視覺領域,另一項技術(shù)的重要性也不遑多讓,那就是行人重識別(ReID)技術(shù)。

ReID:計算機視覺研究的新風口

行人重識別(Person Re-Identification,簡稱 ReID)也稱作跨鏡追蹤技術(shù),是當前計算機視覺領域的熱門研究方向。顧名思義,這項技術(shù)可以根據(jù)行人的衣著、體態(tài)、發(fā)型等一系列特征檢索不同攝像頭下的同一個目標人物,以此描繪出他的行進軌跡。

近年來越來越多的研究人員和機構(gòu)開始投身到ReID技術(shù)的研究中來。這一趨勢從歷年計算機視覺頂會發(fā)表的ReID相關(guān)論文數(shù)量就可窺見一斑。2013年,計算機視覺頂級會議CVPR上發(fā)表的ReID相關(guān)論文數(shù)量只有1篇,到2018年已經(jīng)增加到了32篇。同一時間,另外兩大計算機視覺頂會ECCV和ICCV發(fā)表的ReID相關(guān)論文數(shù)量也都從3篇增加到了19篇。

ReID技術(shù)發(fā)展道路上的三重大山

在眾多科研人員的共同努力下,近年來ReID技術(shù)已經(jīng)取得了長足的發(fā)展。但必須承認的是,現(xiàn)階段ReID技術(shù)的研究仍然面臨著不少的現(xiàn)實挑戰(zhàn),主要有幾個方面:

首先是數(shù)據(jù),和其他視覺任務相比,ReID的數(shù)據(jù)規(guī)模是非常小的。目前ReID領域的公開數(shù)據(jù)集所含的ID數(shù)量不超過6000個。相比之下,人臉識別的公開數(shù)據(jù)集ID數(shù)量已經(jīng)超過了100萬,而企業(yè)私有的ID規(guī)模更在此之上。

導致ReID訓練數(shù)據(jù)缺乏的主要原因在于,行人數(shù)據(jù)集需要采集同一個人在一段時間內(nèi)同時出現(xiàn)在多個攝像頭下的畫面,如此嚴苛的條件無疑對行人數(shù)據(jù)集的構(gòu)建造成了巨大挑戰(zhàn)。

除了數(shù)據(jù)缺失,數(shù)據(jù)標注也是一個不小的挑戰(zhàn)。數(shù)據(jù)標注是一件工作量特別龐大的事情,要知道大規(guī)模圖像分類數(shù)據(jù)集 ImageNet通過眾包的形式,前后有4.8 萬人花了近兩年時間才標注完成。此外,行人數(shù)據(jù)的標注本身有時也是非常困難的。區(qū)分貓狗非常容易,但要在視頻中將兩個年齡、體貌相似,穿著同樣衣服的不同行人分開是比較困難的。

其次是算法。ReID技術(shù)的發(fā)展大致經(jīng)歷了兩個階段:2014年以前主要是依靠一些傳統(tǒng)方法,比如設計手工特征等;2014年以后則基本是基于深度學習的方法。眾所周知,深度學習算法的訓練依賴于大量的高質(zhì)量數(shù)據(jù)。而ReID相關(guān)的訓練數(shù)據(jù)不僅數(shù)量少,質(zhì)量也很難保障。

現(xiàn)有的視頻監(jiān)控設備受成像質(zhì)量、分辨率等因素的制約,抓取的圖像信息經(jīng)常是模糊不清的。另外,相機拍攝角度差異大、室內(nèi)室外環(huán)境變化、行人服裝配飾更換、季節(jié)性穿衣風格差別大、白天晚上光線差異等因素,也給跨攝像頭、跨地區(qū)、跨時間的ReID分析造成了巨大挑戰(zhàn)。

最后,技術(shù)落地,性價比也是一個需要特別關(guān)注的問題。在一般人看來,算法的準確率提升幾個百分點或許微不足道,但背后卻意味著巨額的成本提升。因此,在準確率不夠完美的情況下要將技術(shù)落地,我們還必須做很多的應用創(chuàng)新,比如計算速度和內(nèi)存開銷的優(yōu)化。

總而言之,ReID技術(shù)的突破肯定離不開兩個方面——數(shù)據(jù)和方法。數(shù)據(jù)層面,一方面我們要構(gòu)建更大的真實數(shù)據(jù)集,另一方面也可以通過3D Graphics等方法做數(shù)據(jù)生成。方法層面,業(yè)界之前往往只考慮視覺信息,其實現(xiàn)實世界中我們還可以對大量其他信息加以利用,比如WiFi、GPS等等。

ReID技術(shù)的幾大前沿研究方向

針對數(shù)據(jù)和方法兩個層面,目前業(yè)內(nèi)部分科研機構(gòu)和企業(yè)已經(jīng)相繼有所突破。

比如,針對數(shù)據(jù)不足的問題,有研究團隊提出了數(shù)據(jù)增強與數(shù)據(jù)遷移算法。假設我們想將標注好的北京的數(shù)據(jù)用在上海的某個場景下,就可以通過遷移算法將其遷移到上海的場景中,遷移后的數(shù)據(jù)就像在上海拍攝的一樣。

再比如,為了應對非理想場景的挑戰(zhàn),我們可以用人體部件提取的方法來提取人體的細粒度部件,并進行矯正。值得注意的是,由于需要提取非常精細的人體部件,此類算法對遮擋以及人體關(guān)鍵點檢測誤差比較敏感?;诖?,有團隊提出了粗粒度部件提取方法,僅需提取三個粗粒度部件就能得到非常好的性能。

此外,在應用層面結(jié)合人臉識別和ReID各自的特點及優(yōu)勢,也是一個值得探索的話題。比如千視通提出的卡視聯(lián)動技戰(zhàn)法,以少量的人臉卡口加大量的普通監(jiān)控探頭的部署,既可定嫌疑人身份,又能重現(xiàn)嫌疑人軌跡,這種創(chuàng)新的綜合型技戰(zhàn)法可以較大概率對監(jiān)控范圍進行覆蓋,具有極強的實戰(zhàn)價值。

全國人工智能大賽為ReID技術(shù)發(fā)展添柴加薪

首屆全國人工智能大賽由深圳市科創(chuàng)委、鵬城實驗室、新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟(AITISA)共同承辦,騰訊科技、創(chuàng)維集團、云天勵飛、平安科技協(xié)辦。這是深圳市首次主辦高規(guī)格、大規(guī)模的人工智能領域權(quán)威賽事。大賽將鏈接全國頂尖AI科研平臺及行業(yè)巨頭,為我國AI大科學裝置豐富數(shù)據(jù)集,并精準聚焦AI、4K、行人識別等前沿領域,打通產(chǎn)學研通道,立足深圳集聚全球AI青年人才,為深圳建設中國特色社會主義先行示范區(qū)、建設國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)、推動粵港澳大灣區(qū)人工智能產(chǎn)業(yè)發(fā)展提供重要支撐。

大賽技術(shù)委員會主席提到,本屆大賽賽題設計的目的主要聚焦于 Video和Vision領域。在“Person ReID”賽道,更多的是希望解決關(guān)于場景、跨視角、光照/分辨率影響等技術(shù)難題。

為了進一步推動ReID的技術(shù)突破和落地應用,10月22日啟動的首屆“全國人工智能大賽”專門設置了“行人重識別(Person ReID)”賽項,面向全國廣泛征集來自高校、企業(yè)、科研單位等的團隊和個人參賽。獲獎者除獲得20萬至100萬元獎金外,還有機會獲得頂尖高科技單位招聘綠色通道、科研經(jīng)費、人才政策、研發(fā)空間等全方位支持。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉