AI領域未來有什么新的方向

時間：2020-05-19 09:36:01

關(guān)鍵字： AI 人工智能大賽計算機視覺

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀] 為了進一步推動ReID的技術(shù)突破和落地應用，10月22日啟動的首屆“全國人工智能大賽”專門設置了“行人重識別（Person ReID）”賽項，面向全國廣泛征集來自高校、企業(yè)、科研單位等的團隊和個

為了進一步推動ReID的技術(shù)突破和落地應用，10月22日啟動的首屆“全國人工智能大賽”專門設置了“行人重識別（Person ReID）”賽項，面向全國廣泛征集來自高校、企業(yè)、科研單位等的團隊和個人參賽。

作者 | 劉偉

談到人工智能，大眾最耳熟能詳?shù)漠攲?u>人臉識別技術(shù)，它已經(jīng)滲透到了我們生活的方方面面。但在計算機視覺領域，另一項技術(shù)的重要性也不遑多讓，那就是行人重識別（ReID）技術(shù)。

ReID：計算機視覺研究的新風口

行人重識別（Person Re-Identification，簡稱 ReID）也稱作跨鏡追蹤技術(shù)，是當前計算機視覺領域的熱門研究方向。顧名思義，這項技術(shù)可以根據(jù)行人的衣著、體態(tài)、發(fā)型等一系列特征檢索不同攝像頭下的同一個目標人物，以此描繪出他的行進軌跡。

近年來越來越多的研究人員和機構(gòu)開始投身到ReID技術(shù)的研究中來。這一趨勢從歷年計算機視覺頂會發(fā)表的ReID相關(guān)論文數(shù)量就可窺見一斑。2013年，計算機視覺頂級會議CVPR上發(fā)表的ReID相關(guān)論文數(shù)量只有1篇，到2018年已經(jīng)增加到了32篇。同一時間，另外兩大計算機視覺頂會ECCV和ICCV發(fā)表的ReID相關(guān)論文數(shù)量也都從3篇增加到了19篇。

ReID技術(shù)發(fā)展道路上的三重大山

在眾多科研人員的共同努力下，近年來ReID技術(shù)已經(jīng)取得了長足的發(fā)展。但必須承認的是，現(xiàn)階段ReID技術(shù)的研究仍然面臨著不少的現(xiàn)實挑戰(zhàn)，主要有幾個方面：

首先是數(shù)據(jù)，和其他視覺任務相比，ReID的數(shù)據(jù)規(guī)模是非常小的。目前ReID領域的公開數(shù)據(jù)集所含的ID數(shù)量不超過6000個。相比之下，人臉識別的公開數(shù)據(jù)集ID數(shù)量已經(jīng)超過了100萬，而企業(yè)私有的ID規(guī)模更在此之上。

導致ReID訓練數(shù)據(jù)缺乏的主要原因在于，行人數(shù)據(jù)集需要采集同一個人在一段時間內(nèi)同時出現(xiàn)在多個攝像頭下的畫面，如此嚴苛的條件無疑對行人數(shù)據(jù)集的構(gòu)建造成了巨大挑戰(zhàn)。

除了數(shù)據(jù)缺失，數(shù)據(jù)標注也是一個不小的挑戰(zhàn)。數(shù)據(jù)標注是一件工作量特別龐大的事情，要知道大規(guī)模圖像分類數(shù)據(jù)集 ImageNet通過眾包的形式，前后有4.8 萬人花了近兩年時間才標注完成。此外，行人數(shù)據(jù)的標注本身有時也是非常困難的。區(qū)分貓狗非常容易，但要在視頻中將兩個年齡、體貌相似，穿著同樣衣服的不同行人分開是比較困難的。

其次是算法。ReID技術(shù)的發(fā)展大致經(jīng)歷了兩個階段：2014年以前主要是依靠一些傳統(tǒng)方法，比如設計手工特征等；2014年以后則基本是基于深度學習的方法。眾所周知，深度學習算法的訓練依賴于大量的高質(zhì)量數(shù)據(jù)。而ReID相關(guān)的訓練數(shù)據(jù)不僅數(shù)量少，質(zhì)量也很難保障。

現(xiàn)有的視頻監(jiān)控設備受成像質(zhì)量、分辨率等因素的制約，抓取的圖像信息經(jīng)常是模糊不清的。另外，相機拍攝角度差異大、室內(nèi)室外環(huán)境變化、行人服裝配飾更換、季節(jié)性穿衣風格差別大、白天晚上光線差異等因素，也給跨攝像頭、跨地區(qū)、跨時間的ReID分析造成了巨大挑戰(zhàn)。

最后，技術(shù)落地，性價比也是一個需要特別關(guān)注的問題。在一般人看來，算法的準確率提升幾個百分點或許微不足道，但背后卻意味著巨額的成本提升。因此，在準確率不夠完美的情況下要將技術(shù)落地，我們還必須做很多的應用創(chuàng)新，比如計算速度和內(nèi)存開銷的優(yōu)化。

總而言之，ReID技術(shù)的突破肯定離不開兩個方面——數(shù)據(jù)和方法。數(shù)據(jù)層面，一方面我們要構(gòu)建更大的真實數(shù)據(jù)集，另一方面也可以通過3D Graphics等方法做數(shù)據(jù)生成。方法層面，業(yè)界之前往往只考慮視覺信息，其實現(xiàn)實世界中我們還可以對大量其他信息加以利用，比如WiFi、GPS等等。

ReID技術(shù)的幾大前沿研究方向

針對數(shù)據(jù)和方法兩個層面，目前業(yè)內(nèi)部分科研機構(gòu)和企業(yè)已經(jīng)相繼有所突破。

比如，針對數(shù)據(jù)不足的問題，有研究團隊提出了數(shù)據(jù)增強與數(shù)據(jù)遷移算法。假設我們想將標注好的北京的數(shù)據(jù)用在上海的某個場景下，就可以通過遷移算法將其遷移到上海的場景中，遷移后的數(shù)據(jù)就像在上海拍攝的一樣。

再比如，為了應對非理想場景的挑戰(zhàn)，我們可以用人體部件提取的方法來提取人體的細粒度部件，并進行矯正。值得注意的是，由于需要提取非常精細的人體部件，此類算法對遮擋以及人體關(guān)鍵點檢測誤差比較敏感?；诖?，有團隊提出了粗粒度部件提取方法，僅需提取三個粗粒度部件就能得到非常好的性能。

此外，在應用層面結(jié)合人臉識別和ReID各自的特點及優(yōu)勢，也是一個值得探索的話題。比如千視通提出的卡視聯(lián)動技戰(zhàn)法，以少量的人臉卡口加大量的普通監(jiān)控探頭的部署，既可鎖定嫌疑人身份，又能重現(xiàn)嫌疑人軌跡，這種創(chuàng)新的綜合型技戰(zhàn)法可以較大概率對監(jiān)控范圍進行覆蓋，具有極強的實戰(zhàn)價值。

全國人工智能大賽為ReID技術(shù)發(fā)展添柴加薪

首屆全國人工智能大賽由深圳市科創(chuàng)委、鵬城實驗室、新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟（AITISA）共同承辦，騰訊科技、創(chuàng)維集團、云天勵飛、平安科技協(xié)辦。這是深圳市首次主辦高規(guī)格、大規(guī)模的人工智能領域權(quán)威賽事。大賽將鏈接全國頂尖AI科研平臺及行業(yè)巨頭，為我國AI大科學裝置豐富數(shù)據(jù)集，并精準聚焦AI、4K、行人識別等前沿領域，打通產(chǎn)學研通道，立足深圳集聚全球AI青年人才，為深圳建設中國特色社會主義先行示范區(qū)、建設國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)、推動粵港澳大灣區(qū)人工智能產(chǎn)業(yè)發(fā)展提供重要支撐。

大賽技術(shù)委員會主席提到，本屆大賽賽題設計的目的主要聚焦于 Video和Vision領域。在“Person ReID”賽道，更多的是希望解決關(guān)于場景、跨視角、光照/分辨率影響等技術(shù)難題。

為了進一步推動ReID的技術(shù)突破和落地應用，10月22日啟動的首屆“全國人工智能大賽”專門設置了“行人重識別（Person ReID）”賽項，面向全國廣泛征集來自高校、企業(yè)、科研單位等的團隊和個人參賽。獲獎者除獲得20萬至100萬元獎金外，還有機會獲得頂尖高科技單位招聘綠色通道、科研經(jīng)費、人才政策、研發(fā)空間等全方位支持。