當(dāng)前位置：首頁 > 公眾號精選 > 程序員小灰

臥槽！出了一個Python實時目標跟蹤系統(tǒng)神器！

時間：2021-11-29 14:42:25

關(guān)鍵字：目標跟蹤系統(tǒng)

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀]在當(dāng)下自動駕駛、智慧城市、安防等領(lǐng)域?qū)囕v、行人、飛行器等快速移動的物體進行實時跟蹤及分析的需求可謂比比皆是，但單純的目標檢測算法只能輸出目標的定位分類，無法對移動的目標具體的運動行為及特征進行分析，因此在具體的車輛行為分析、交通違章判別、嫌疑犯追蹤、飛行器監(jiān)管等場景，目標追蹤發(fā)...

在當(dāng)下自動駕駛、智慧城市、安防等領(lǐng)域?qū)?span>車輛、行人、飛行器等快速移動的物體進行實時跟蹤及分析的需求可謂比比皆是，但單純的目標檢測算法只能輸出目標的定位分類，無法對移動的目標具體的運動行為及特征進行分析，因此在具體的車輛行為分析、交通違章判別、嫌疑犯追蹤、飛行器監(jiān)管等場景，目標追蹤發(fā)揮著不可替代的作用。

視頻引用公開數(shù)據(jù)集[1][2][3][4]

但實際目標追蹤的項目落地，往往面臨被檢目標多、相互遮擋、圖像扭曲變形、背景雜亂、視角差異大、目標小且運動速度快等產(chǎn)業(yè)實際技術(shù)難題。

那如何快速實現(xiàn)高性能的目標跟蹤任務(wù)呢？一個相對完善的目標跟蹤任務(wù)實現(xiàn)，往往需要融合目標檢測、行人重識別、軌跡融合等多項技術(shù)能力，并對上述產(chǎn)業(yè)實際的技術(shù)難點，分別進行長時間深度優(yōu)化，同時考慮跨鏡頭、多類別、小目標跟蹤以及輕量化部署等實際業(yè)務(wù)訴求。

難么？別急，近日在GitHub社區(qū)發(fā)布的一個開源目標跟蹤系統(tǒng)—PP-Tracking就能使開發(fā)者快速用Python完成一個高性能的目標跟蹤任務(wù)，并實現(xiàn)服務(wù)器側(cè)輕量化上線。

它的具體結(jié)構(gòu)圖如下：

關(guān)于詳細的結(jié)構(gòu)詳解，可以前往具體項目鏈接查看：

https://github.com/PaddlePaddle/paddledetection

當(dāng)然，如果你覺得項目確實實用，支持開源最好的方式就是點亮Star星標支持一下

本文作者也確實詳細研究了一下這個項目，總結(jié)了它的一些特點，有耐心的老鐵可以接著往下看：

功能豐富效果佳

PP-Tracking內(nèi)置DeepSORT[6]、JDE[7]與FairMOT[8]三種主流高精度多目標跟蹤模型，并針對產(chǎn)業(yè)痛點、結(jié)合實際落地場景進行一系列拓展和優(yōu)化，覆蓋多類別跟蹤、跨鏡跟蹤、流量統(tǒng)計等功能與應(yīng)用，可謂是精度、性能、功能豐富樣樣俱全~

單鏡頭跟蹤

單鏡頭下的單類別目標跟蹤是指在單個鏡頭下，對于同一種類別的多個目標進行連續(xù)跟蹤，是跟蹤任務(wù)的基礎(chǔ)。針對該任務(wù)，PP-Tracking基于端到端的One Shot高精模型FairMOT[8]，替換為更輕量的骨干網(wǎng)絡(luò)HRNetV2-W18，采用多種Tricks，如Sync_BN與EMA，保持性能的同時大幅提高了精度，并且擴大訓(xùn)練數(shù)據(jù)集，減小輸入尺寸，最終實現(xiàn)服務(wù)端輕量化模型在權(quán)威數(shù)據(jù)集MOT17上精度達到MOTA 65.3，在NVIDIA Jetson NX上速度達到23.3FPS，GPU上速度可達到60FPS！同時，針對對精度要求較高的場景，PP-Tracking還提供了精度高達MOTA75.3的高精版跟蹤模型~

視頻引用公開數(shù)據(jù)集[3]

多類別跟蹤

PP-Tracking不僅高性能地實現(xiàn)了單鏡頭下的單類別目標跟蹤，更針對多種不同類別的目標跟蹤場景，增強了特征匹配模塊以適配不同類別的跟蹤任務(wù)，實現(xiàn)跟蹤類別覆蓋人、自行車、小轎車、卡車、公交、三輪車等上十種目標，精準實現(xiàn)多種不同種類物體的同時跟蹤。

視頻引用公開數(shù)據(jù)集[2]

跨鏡頭跟蹤

安防場景常常會涉及在多個鏡頭下對于目標物體的持續(xù)跟蹤。當(dāng)目標從一個鏡頭切換到另一個鏡頭，往往會出現(xiàn)目標跟丟的情況，這時，一個效果好速度快的跨鏡頭跟蹤算法就必不可少了！PP-Tracking中提供的跨鏡頭跟蹤能力基于DeepSORT[6]算法，采用了百度自研的輕量級模型PP-PicoDet和PP-LCNet分別作為檢測模型和ReID模型，配合軌跡融合算法，保持高性能的同時也兼顧了高準確度，實現(xiàn)在多個鏡頭下緊跟目標，無論鏡頭如何切換、場景如何變換，也能準確跟蹤目標的效果。

視頻引用公開數(shù)據(jù)集[2]

流量監(jiān)測

與此同時，針對智慧城市中的高頻場景—人/車流量監(jiān)測，PP-Tracking也提供了完整的解決方案，應(yīng)用服務(wù)器端輕量級版FairMOT[8]模型預(yù)測得到目標軌跡與ID信息，實現(xiàn)動態(tài)人流/車流的實時去重計數(shù)，并支持自定義流量統(tǒng)計時間間隔。

為了滿足不同業(yè)務(wù)場景下的需求，如商場進出口人流監(jiān)測、高速路口車流量監(jiān)測等，PP-Tracking更是提供了出入口兩側(cè)流量統(tǒng)計方式~

視頻引用公開數(shù)據(jù)集[2]

復(fù)雜場景覆蓋全

行人、車輛跟蹤

智慧交通中，行人和車輛的場景尤為廣泛，因此PP-Tracking針對行人和車輛，提供對應(yīng)的預(yù)訓(xùn)練模型，大幅降低開發(fā)成本，節(jié)省訓(xùn)練時間和數(shù)據(jù)成本，實現(xiàn)業(yè)務(wù)場景直接推理，算法即應(yīng)用的效果！不僅如此，PP-Tracking支持顯示目標軌跡，更直觀地輔助實現(xiàn)高效的路徑規(guī)劃分析。

視頻引用公開數(shù)據(jù)集[2]

人頭跟蹤

不僅如此，除了在日常跟蹤任務(wù)中擁有極強的通用性，針對實際業(yè)務(wù)中常常出現(xiàn)目標遮擋嚴重等問題，PP-Tracking也進行了一系列優(yōu)化，提供了基于FairMOT[8]訓(xùn)練的人頭跟蹤模型，并在Head Tracking 2021數(shù)據(jù)集榜單位居榜首，助力PP-Tracking靈活適配各類行人場景。

視頻引用公開數(shù)據(jù)集[5]

小目標跟蹤

針對小目標出現(xiàn)在大尺幅圖像中的產(chǎn)業(yè)常見難題場景，PP-Tracking進行了一系列的優(yōu)化，提供專門針對小目標跟蹤的預(yù)訓(xùn)練模型，實現(xiàn)在特殊場景，如無人機等航拍場景下，也能達到較為精準的效果~

視頻引用公開數(shù)據(jù)集[2]

兩種使用模式，訓(xùn)練推理靈活掌握

為了滿足不同的開發(fā)需求，PP-Tracking支持兩種使用方式，無論是想通過代碼調(diào)用/訓(xùn)練模型，進行快速推理部署，還是想要零代碼直接上手使用功能，PP-Tracking通通滿足你！

API代碼調(diào)用：API簡潔易用，支持模型調(diào)用、訓(xùn)練與推理部署，最大程度降低開發(fā)成本的前提下，靈活適配各類場景與任務(wù)。

可視化開發(fā)界面：支持單鏡頭下的單、多目標跟蹤，并覆蓋小目標、人/車流量統(tǒng)計等復(fù)雜場景及應(yīng)用，無需任何開發(fā)，即可直接體驗功能，便于集成于各類硬件。

更貼心的是，PP-Tracking支持Python、C 兩種部署語言，同時提供使用飛槳原生推理庫Paddle Inference和飛槳服務(wù)化推理框架Paddle Serving的保姆級部署教程，真正意義上打通從訓(xùn)練、推理到部署的全流程。

產(chǎn)業(yè)場景快速融合

這么厲害的實時跟蹤系統(tǒng)在實際落地中的表現(xiàn)如何呢？接下來，讓我們看看PP-Tracking的實際業(yè)務(wù)落地效果吧~

以人流量計數(shù)為例，在上海音智達公司的實際業(yè)務(wù)中，使用PP-Tracking中的服務(wù)端輕量化版FairMOT[8]，結(jié)合人流量計數(shù)功能，快速實現(xiàn)商圈出入口的實時人流量去重計數(shù)。

視頻引用公開數(shù)據(jù)集[3]

被應(yīng)用于自動駕駛、安防、交通、城市等多種領(lǐng)域的目標跟蹤你學(xué)會了么？想要深入了解案例細節(jié)？掌握跟蹤的應(yīng)用？快報名直播課程吧！

深入直播講解

為了讓開發(fā)者們更深入的了解PP-Tracking這套多功能的跟蹤系統(tǒng)，解決產(chǎn)業(yè)應(yīng)用難點以及掌握產(chǎn)業(yè)實踐的核心能力，飛槳團隊精心準備了為期四天的直播課程！

11月23日-26日19:00-20:00，百度資深高工將深入解讀通用目標檢測的基礎(chǔ)理論與實踐、超輕人體關(guān)鍵點模型的理論及應(yīng)用，并全方位解析實時跟蹤系統(tǒng)，對各類痛難點解決方案進行手把手拆解，更有直播現(xiàn)場為大家答疑解惑，還在等什么！抓緊掃碼上車吧！

掃碼報名直播課，加入技術(shù)交流群

精彩內(nèi)容搶先看

圖片數(shù)據(jù)引用說明

[1] Yu F, Chen H, Wang X, et al. Bdd100k: A diverse driving dataset for heterogeneous multitask learning[C]//Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2020: 2636-2645.

[2] Zhu P, Wen L, Du D, et al. Vision meets drones: Past, present and future[J]. arXiv preprint arXiv:2001.06303, 2020.

[3] Milan A, Leal-Taixé L, Reid I, et al. MOT16: A benchmark for multi-object tracking[J]. arXiv preprint arXiv:1603.00831, 2016.

[4] Bai H, Cheng W, Chu P, et al. GMOT-40: A Benchmark for Generic Multiple Object Tracking[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021: 6719-6728.

[5] Sundararaman R, De Almeida Braga C, Marchand E, et al. Tracking Pedestrian Heads in Dense Crowd[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021: 3865-3875.

模型引用說明

[6] DeepSORT: Veeramani B, Raymond J W, Chanda P. DeepSort: deep convolutional networks for sorting haploid maize seeds[J]. BMC bioinformatics, 2018, 19(9): 1-9.

[7] JDE: Wang Z, Zheng L, Liu Y, et al. Towards real-time multi-object tracking[C]//Computer Vision–ECCV 2020: 16th European Conference, Glasgow, UK, August 23–28, 2020, Proceedings, Part XI 16. Springer International Publishing, 2020: 107-122.

[8] FairMOT: Zhang Y, Wang C, Wang X, et al. Fairmot: On the fairness of detection and re-identification in multiple object tracking[J]. International Journal of Computer Vision, 2021: 1-19.

本站聲明：本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

洞察2022：中國電感器件行業(yè)競爭格局及市場份額

電感是導(dǎo)線內(nèi)通過交流電流時，在導(dǎo)線的內(nèi)部及其周圍產(chǎn)生交變磁通，導(dǎo)線的磁通量與生產(chǎn)此磁通的電流之比。電感器也叫電感線圈，是利用電磁感應(yīng)原理制成的，由導(dǎo)線在絕緣管上單層或多層繞制而成的，導(dǎo)線彼此互相絕緣，而絕緣管可以是空心的...

關(guān)鍵字：電感磁通量電感器

[瞻研究]

預(yù)見2022：《2022年中國智慧港口產(chǎn)業(yè)全景圖譜》

根據(jù)交通運輸部水運科學(xué)研究院提出的智慧港口的概念，智慧港口是利用新一代信息技術(shù)，將港口相關(guān)業(yè)務(wù)和管理創(chuàng)新深度融合，使港口更加集約、高效、便捷、安全、綠色，創(chuàng)新港口發(fā)展模式，實現(xiàn)港口科學(xué)可持續(xù)發(fā)展。

關(guān)鍵字：智慧港口信息技術(shù) 業(yè)務(wù)

[瞻研究]

【建議收藏】重磅！2022年上海市新能源汽車產(chǎn)業(yè)鏈全景圖譜

近年來，世界主要汽車大國紛紛加強新能源汽車戰(zhàn)略謀劃、強化政策支持、完善產(chǎn)業(yè)布局，新能源汽車已成為全球汽車產(chǎn)業(yè)轉(zhuǎn)型發(fā)展的主要方向和促進世界經(jīng)濟持續(xù)增長的重要引擎。2021年，全國新能源汽車實現(xiàn)產(chǎn)量354.5萬輛，銷量352...

關(guān)鍵字：新能源汽車引擎

[瞻研究]

收藏！《2022年全球針狀焦行業(yè)技術(shù)全景圖譜》

2007-2021年，全球針狀焦行業(yè)專利申請人數(shù)量及專利申請量總體呈現(xiàn)增長態(tài)勢。雖然2021年全球針狀焦行業(yè)專利申請人數(shù)量及專利申請量有所下降，但是這兩大指標數(shù)量仍較多。整體來看，全球針狀焦技術(shù)處于成長期。

關(guān)鍵字：針狀焦行業(yè) 專利申請人增長態(tài)勢

[瞻研究]

洞察2022：中國智能家居行業(yè)競爭格局及市場份額

按企業(yè)主營業(yè)務(wù)類型分，我國智能家居行業(yè)競爭派系可分為傳統(tǒng)家電企業(yè)、互聯(lián)網(wǎng)企業(yè)以及其他企業(yè)三派。傳統(tǒng)家電企業(yè)代表有海爾智家、美的集團、格力電器等，具有供應(yīng)鏈和銷售渠道，制造能力和品牌優(yōu)勢突出;互聯(lián)網(wǎng)企業(yè)代表有小米集團、百度...

關(guān)鍵字：智能家居互聯(lián)網(wǎng)企業(yè) 供應(yīng)鏈

[瞻研究]

預(yù)見2022：《2022年中國軍工電子行業(yè)全景圖譜》

軍工電子是集紅外技術(shù)、激光技術(shù)、半導(dǎo)體及嵌入式技術(shù)與虛擬仿真技術(shù)為一體的綜合性軍工技術(shù)體系，是國防信息化建設(shè)的基石。軍工電子行業(yè)包含在軍工行業(yè)內(nèi)，專注于軍工行業(yè)電子產(chǎn)品布局。根據(jù)其軍工產(chǎn)品的不同可分為衛(wèi)星導(dǎo)航、通信指揮、...

關(guān)鍵字：軍工電子嵌入式技術(shù) 信息化建設(shè)

[瞻研究]

洞察2022：中國汽車零配件行業(yè)競爭格局及市場份額

我國汽車零配件行業(yè)細分種類眾多，從汽車零配件主要產(chǎn)品來看，發(fā)動機系統(tǒng)行業(yè)內(nèi)有濰柴動力、華域汽車等主要從業(yè)企業(yè);在車身零部件領(lǐng)域內(nèi)，福耀玻璃、中策橡膠具有一定的規(guī)模優(yōu)勢;行駛系統(tǒng)領(lǐng)域內(nèi)有中策橡膠提供的輪胎以及華為等企業(yè)提供...

關(guān)鍵字：汽車零配件發(fā)動機行駛系統(tǒng)

[瞻研究]

預(yù)見2022：《2022年中國茶飲料行業(yè)全景圖譜》

茶飲料是指以茶葉或茶葉的水提取液、濃縮液、茶粉(包括速溶茶粉、研磨茶粉)或直接以茶的鮮葉為原料添加或不添加食品原輔料和(或)食品添加劑，經(jīng)加工制成的液體飲料。根據(jù)國家標準《茶飲料(GB/T 21733-2008)》的規(guī)定...

關(guān)鍵字：茶飲料茶葉的水食品添加劑

[瞻研究]

收藏！《2022年全球液壓行業(yè)技術(shù)全景圖譜》

全球液壓行業(yè)專利技術(shù)在21世紀初得到初步發(fā)展，這一時期液壓專利申請人數(shù)量和申請量處于較低水平。2011-2012年，液壓行業(yè)專利技術(shù)的發(fā)展總體處于成長期，2012年以后中全球液壓行業(yè)專利技術(shù)申請量或申請人數(shù)量整體處于波動...

關(guān)鍵字：液壓行業(yè) 專利授權(quán) 技術(shù)類型

[瞻研究]