目標(biāo)檢測領(lǐng)域最優(yōu) 中科智云獲國際頂級賽事VOT兩項挑戰(zhàn)賽冠軍
上海2021年12月8日 /美通社/ -- 近日,繼2019-2020年獲得視覺跟蹤領(lǐng)域國際頂級賽事 VOT(Visual-Object-Tracking Challenge )多項挑戰(zhàn)賽冠軍以來,中科智云-大連理工聯(lián)合AI實驗室在今年計算機視覺三大頂會之一 -- 國際計算機視覺大會ICCV2021上舉辦的VOT 2021中再次披荊斬棘,包攬了五個賽道中兩項挑戰(zhàn)賽的冠軍:
VOT-RT2021(實時目標(biāo)跟蹤挑戰(zhàn)賽);
VOT-RGBD2021(顏色和深度的長時跟蹤挑戰(zhàn)賽)。
VOT是國際目標(biāo)跟蹤領(lǐng)域最權(quán)威的測評平臺,由于每年的評測序列都會更新,且標(biāo)注的精確度逐年提高,VOT競賽也被視為視覺跟蹤領(lǐng)域最難的競賽。VOT挑戰(zhàn)為跟蹤社區(qū)提供了一種精確定義和可重復(fù)的方法,用于比較短期跟蹤者和長期跟蹤者,以及討論視覺跟蹤領(lǐng)域的評估和進展的通用平臺。
視覺目標(biāo)跟蹤是計算機視覺中的一個重要研究方向,有著廣泛的應(yīng)用,如:視頻監(jiān)控,人機交互,無人駕駛等。傳統(tǒng)的目標(biāo)跟蹤算法采用相關(guān)性運算方式來實現(xiàn)模板與搜索區(qū)域相似度的簡單融合。然而,相關(guān)運算本身是一個局部線性匹配過程,容易丟失語義信息,容易陷入局部最優(yōu),這可能是設(shè)計高精度跟蹤算法的瓶頸。
此次中科智云-大連理工聯(lián)合AI實驗室提出了一個新的基于Transformer 跟蹤框架TransT-M,能有效的結(jié)合注意力機制把模板和搜索區(qū)域的特征信息融合起來產(chǎn)生一個高性能目標(biāo)跟蹤器。該注意力機制同時又融合了基于自我注意的自我上下文增強模塊和基于交叉注意力的跨特征增強模塊,確保長距離跟蹤需要的充足的上下文有效信息,同時避免了不必要的信息干擾。實驗表明,我們的 TransT-M 在六個具有挑戰(zhàn)性的數(shù)據(jù)集上,尤其是在大規(guī)模 LaSOT、TrackingNet 和 GOT-10k 基準測試上,無論在精度還是效率遠遠超出了目前現(xiàn)有算法,取得了非常不俗的結(jié)果。目前該算法已經(jīng)納入到智云X-Brain平臺的目標(biāo)物體視頻模塊中使用,為X-Brain的客戶提供最好的體驗。
中科智云近年來已經(jīng)先后在視頻跟蹤分割領(lǐng)域內(nèi)的多個國際挑戰(zhàn)大賽中獲得了領(lǐng)先的名次,標(biāo)志著中科智云在視頻目標(biāo)檢測,跟蹤和分割技術(shù)等視頻智能分析的關(guān)鍵技術(shù)已處于業(yè)界領(lǐng)先水平。這些技術(shù)將在國內(nèi)外的智能建造、智慧城市、智慧農(nóng)業(yè)、智慧交通、智慧醫(yī)療等領(lǐng)域的5G+AR視頻業(yè)務(wù)中獲得廣泛應(yīng)用。
歷屆VOT獲獎情況:
于2019年獲得 VOT-LT2019(Long-term tracking challenge,即長時跟蹤挑戰(zhàn)賽)冠軍,
于2020年獲得三項挑戰(zhàn)賽的冠軍
VOT-RT2020(Short-term Real-time tracking challenge,即實時跟蹤挑戰(zhàn)賽)
VOT-LT2020(Long-term tracking challenge,即長時跟蹤挑戰(zhàn)賽)
VOT-RGBD2020(Color and depth long-term tracking challenge。即顏色和深度的長期跟蹤挑戰(zhàn)賽)
中科智云作為計算機視覺領(lǐng)域的“佼佼者”,擁有全球頂尖的AI技術(shù)研發(fā)能力,并已實現(xiàn)關(guān)鍵核心技術(shù)國產(chǎn)可控。目前已與牛津大學(xué)、帝國理工等全球知名院校成立7家聯(lián)合實驗室;成立兩年來,公司已申請近50件國內(nèi)國際AI專利,多次在全球頂級會議發(fā)布論文,并斬獲多個國際大賽佳績。