澎思科技刷新視頻行人再識別三大數(shù)據(jù)集歷史最好成績
繼在三大主流單幀圖片行人再識別數(shù)據(jù)集(Market1501,DukeMTMC-reID,CUHK03)刷新世界紀錄后,近日,澎思科技(Pensees)在基于視頻的行人再識別數(shù)據(jù)集(PRID-2011,iLIDS-VID,MA RS)中再次取得突破性進展,一舉實現(xiàn)在三大數(shù)據(jù)集上實現(xiàn)算法關(guān)鍵指標首位命中率(Rank-1 Accuracy)大幅度提升,準確率均創(chuàng)歷史新高。
PRID-2011、iLIDS-VID和MARS均為基于視頻的行人再識別數(shù)據(jù)集。PRID-2011數(shù)據(jù)集中的視頻對通過兩個固定的監(jiān)控攝像頭進行采集,攝像頭A包含385個行人,攝像頭B包含749個行人。
這些行人中,只有200個行人同時出現(xiàn)在兩個攝像頭中。
iLIDS-VID是在PRID-2011之后公布的數(shù)據(jù)集,與PRID-2011相比,數(shù)據(jù)更加整齊,也更有挑戰(zhàn)性。iLIDS-VID數(shù)據(jù)集是通過機場到達大廳的CCTV監(jiān)控視頻采集得到的,包含300個行人在兩個攝像頭下的600段視頻。視頻中存在嚴重的著裝相似,光照和視角變化,復(fù)雜背景和遮擋現(xiàn)象,因此識別難度大。
MARS數(shù)據(jù)集是目前基于視頻ReID最大的數(shù)據(jù)集,是單幀圖片行人再識別數(shù)據(jù)集Market1501的擴充版,圖像數(shù)量由32,668幅擴展到了1,191,003幅。 與單幀圖片的行人再識別數(shù)據(jù)集一樣,首位命中率(Rank-1 Accuracy)和平均精度均值(Mean Average Precision,mAP)是衡量視頻行人再識別ReID算法水平的核心指標。
澎思科技此次一舉實現(xiàn)在三大數(shù)據(jù)庫上,僅利用原始數(shù)據(jù)就實現(xiàn)Rank-1 Accuracy關(guān)鍵指標大幅度提升。目前,澎思科技算法在最大的視頻數(shù)據(jù)集MARS上的首位命中率指標已經(jīng)達到88.8%,領(lǐng)先香港中文大學、中科大、北京大學等國內(nèi)外知名機構(gòu)。
在iLIDS-VID和PRID-2011等數(shù)據(jù)集上首位命中率也分別達到了88.0%和95.5%。
澎思科技行人再識別ReID算法在MARS數(shù)據(jù)集的部分測試結(jié)果