為了進一步推動ReID的技術(shù)突破和落地應用,10月22日啟動的首屆“全國人工智能大賽”專門設置了“行人重識別(Person ReID)”賽項,面向全國廣泛征集來自高校、企業(yè)、科研單位等的團隊和個人參賽。
作者 | 劉偉
談到人工智能,大眾最耳熟能詳?shù)漠攲?u>人臉識別技術(shù),它已經(jīng)滲透到了我們生活的方方面面。但在計算機視覺領域,另一項技術(shù)的重要性也不遑多讓,那就是行人重識別(ReID)技術(shù)。
ReID:計算機視覺研究的新風口
行人重識別(Person Re-Identification,簡稱 ReID)也稱作跨鏡追蹤技術(shù),是當前計算機視覺領域的熱門研究方向。顧名思義,這項技術(shù)可以根據(jù)行人的衣著、體態(tài)、發(fā)型等一系列特征檢索不同攝像頭下的同一個目標人物,以此描繪出他的行進軌跡。
近年來越來越多的研究人員和機構(gòu)開始投身到ReID技術(shù)的研究中來。這一趨勢從歷年計算機視覺頂會發(fā)表的ReID相關(guān)論文數(shù)量就可窺見一斑。2013年,計算機視覺頂級會議CVPR上發(fā)表的ReID相關(guān)論文數(shù)量只有1篇,到2018年已經(jīng)增加到了32篇。同一時間,另外兩大計算機視覺頂會ECCV和ICCV發(fā)表的ReID相關(guān)論文數(shù)量也都從3篇增加到了19篇。
ReID技術(shù)發(fā)展道路上的三重大山
在眾多科研人員的共同努力下,近年來ReID技術(shù)已經(jīng)取得了長足的發(fā)展。但必須承認的是,現(xiàn)階段ReID技術(shù)的研究仍然面臨著不少的現(xiàn)實挑戰(zhàn),主要有幾個方面:
首先是數(shù)據(jù),和其他視覺任務相比,ReID的數(shù)據(jù)規(guī)模是非常小的。目前ReID領域的公開數(shù)據(jù)集所含的ID數(shù)量不超過6000個。相比之下,人臉識別的公開數(shù)據(jù)集ID數(shù)量已經(jīng)超過了100萬,而企業(yè)私有的ID規(guī)模更在此之上。
導致ReID訓練數(shù)據(jù)缺乏的主要原因在于,行人數(shù)據(jù)集需要采集同一個人在一段時間內(nèi)同時出現(xiàn)在多個攝像頭下的畫面,如此嚴苛的條件無疑對行人數(shù)據(jù)集的構(gòu)建造成了巨大挑戰(zhàn)。
除了數(shù)據(jù)缺失,數(shù)據(jù)標注也是一個不小的挑戰(zhàn)。數(shù)據(jù)標注是一件工作量特別龐大的事情,要知道大規(guī)模圖像分類數(shù)據(jù)集 ImageNet通過眾包的形式,前后有4.8 萬人花了近兩年時間才標注完成。此外,行人數(shù)據(jù)的標注本身有時也是非常困難的。區(qū)分貓狗非常容易,但要在視頻中將兩個年齡、體貌相似,穿著同樣衣服的不同行人分開是比較困難的。
其次是算法。ReID技術(shù)的發(fā)展大致經(jīng)歷了兩個階段:2014年以前主要是依靠一些傳統(tǒng)方法,比如設計手工特征等;2014年以后則基本是基于深度學習的方法。眾所周知,深度學習算法的訓練依賴于大量的高質(zhì)量數(shù)據(jù)。而ReID相關(guān)的訓練數(shù)據(jù)不僅數(shù)量少,質(zhì)量也很難保障。
現(xiàn)有的視頻監(jiān)控設備受成像質(zhì)量、分辨率等因素的制約,抓取的圖像信息經(jīng)常是模糊不清的。另外,相機拍攝角度差異大、室內(nèi)室外環(huán)境變化、行人服裝配飾更換、季節(jié)性穿衣風格差別大、白天晚上光線差異等因素,也給跨攝像頭、跨地區(qū)、跨時間的ReID分析造成了巨大挑戰(zhàn)。
最后,技術(shù)落地,性價比也是一個需要特別關(guān)注的問題。在一般人看來,算法的準確率提升幾個百分點或許微不足道,但背后卻意味著巨額的成本提升。因此,在準確率不夠完美的情況下要將技術(shù)落地,我們還必須做很多的應用創(chuàng)新,比如計算速度和內(nèi)存開銷的優(yōu)化。
總而言之,ReID技術(shù)的突破肯定離不開兩個方面——數(shù)據(jù)和方法。數(shù)據(jù)層面,一方面我們要構(gòu)建更大的真實數(shù)據(jù)集,另一方面也可以通過3D Graphics等方法做數(shù)據(jù)生成。方法層面,業(yè)界之前往往只考慮視覺信息,其實現(xiàn)實世界中我們還可以對大量其他信息加以利用,比如WiFi、GPS等等。
ReID技術(shù)的幾大前沿研究方向
針對數(shù)據(jù)和方法兩個層面,目前業(yè)內(nèi)部分科研機構(gòu)和企業(yè)已經(jīng)相繼有所突破。
比如,針對數(shù)據(jù)不足的問題,有研究團隊提出了數(shù)據(jù)增強與數(shù)據(jù)遷移算法。假設我們想將標注好的北京的數(shù)據(jù)用在上海的某個場景下,就可以通過遷移算法將其遷移到上海的場景中,遷移后的數(shù)據(jù)就像在上海拍攝的一樣。
再比如,為了應對非理想場景的挑戰(zhàn),我們可以用人體部件提取的方法來提取人體的細粒度部件,并進行矯正。值得注意的是,由于需要提取非常精細的人體部件,此類算法對遮擋以及人體關(guān)鍵點檢測誤差比較敏感?;诖?,有團隊提出了粗粒度部件提取方法,僅需提取三個粗粒度部件就能得到非常好的性能。
此外,在應用層面結(jié)合人臉識別和ReID各自的特點及優(yōu)勢,也是一個值得探索的話題。比如千視通提出的卡視聯(lián)動技戰(zhàn)法,以少量的人臉卡口加大量的普通監(jiān)控探頭的部署,既可鎖定嫌疑人身份,又能重現(xiàn)嫌疑人軌跡,這種創(chuàng)新的綜合型技戰(zhàn)法可以較大概率對監(jiān)控范圍進行覆蓋,具有極強的實戰(zhàn)價值。
全國人工智能大賽為ReID技術(shù)發(fā)展添柴加薪
首屆全國人工智能大賽由深圳市科創(chuàng)委、鵬城實驗室、新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟(AITISA)共同承辦,騰訊科技、創(chuàng)維集團、云天勵飛、平安科技協(xié)辦。這是深圳市首次主辦高規(guī)格、大規(guī)模的人工智能領域權(quán)威賽事。大賽將鏈接全國頂尖AI科研平臺及行業(yè)巨頭,為我國AI大科學裝置豐富數(shù)據(jù)集,并精準聚焦AI、4K、行人識別等前沿領域,打通產(chǎn)學研通道,立足深圳集聚全球AI青年人才,為深圳建設中國特色社會主義先行示范區(qū)、建設國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)、推動粵港澳大灣區(qū)人工智能產(chǎn)業(yè)發(fā)展提供重要支撐。
大賽技術(shù)委員會主席提到,本屆大賽賽題設計的目的主要聚焦于 Video和Vision領域。在“Person ReID”賽道,更多的是希望解決關(guān)于場景、跨視角、光照/分辨率影響等技術(shù)難題。
為了進一步推動ReID的技術(shù)突破和落地應用,10月22日啟動的首屆“全國人工智能大賽”專門設置了“行人重識別(Person ReID)”賽項,面向全國廣泛征集來自高校、企業(yè)、科研單位等的團隊和個人參賽。獲獎者除獲得20萬至100萬元獎金外,還有機會獲得頂尖高科技單位招聘綠色通道、科研經(jīng)費、人才政策、研發(fā)空間等全方位支持。