浪潮信息:自動駕駛多攝像頭BEV場景表示論文入選CVPR 2022
(全球TMT2022年7月5日訊)近日,在國際計算機與模式識別會議CVPR 2022期間,浪潮信息AI團隊提交的論文《Scene Representation in Bird's-Eye View from Surrounding Cameras with Transformers(基于Transformer的多攝像頭BEV場景表示)》成功入選。論文提出了一種基于Transformer的圖像-BEV特征轉(zhuǎn)換框架,能夠生成有效的環(huán)境表示,可以提升自動駕駛車輛對周圍環(huán)境的感知能力。CVPR是計算機視覺領(lǐng)域三大世界頂級會議之一。
浪潮信息AI團隊研究了如何利用環(huán)形攝像頭陣列來對BEV視角的環(huán)境進行特征表示。他們設(shè)計了一種基于Transformer的編解碼模塊,將圖像特征轉(zhuǎn)換為對應的BEV特征。為驗證轉(zhuǎn)換后的BEV特征的有效性,論文引入了三個分割任務:車輛分割、道路分割和車道線分割。整個模型框架如下圖所示,由環(huán)形攝像頭陣列采集的圖像,通過共享的圖像編碼器得到各種的圖像特征。然后,CBTR(Camera-BEV Transformation)模塊將圖像特征轉(zhuǎn)換為對應的BEV特征。最后,利用生成的BEV特征圖,多個檢測頭分別完成各自的分割任務。