NEC攜手東京工業(yè)大學(xué)，以AI技術(shù)視覺識(shí)別度

時(shí)間：2017-06-12 14:19:37

關(guān)鍵字： nec 視覺識(shí)別

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]NEC與日本國立大學(xué)法人東京工業(yè)大學(xué)工學(xué)院奧富正敏教授、田中正行特定副教授的研究團(tuán)隊(duì)(以下簡稱東京工業(yè)大學(xué))共同開發(fā)了“多模(注1)圖像融合技術(shù)”，通過AI技術(shù)將一般攝像頭拍攝的可見光圖像與熱成像相機(jī)拍攝的非可見光圖像進(jìn)行自動(dòng)高效合成，且提高了單個(gè)圖像拍攝時(shí)的視覺識(shí)別度。

視覺識(shí)別系統(tǒng)是指將企業(yè)的一切可視事物進(jìn)行統(tǒng)一的視覺識(shí)別表現(xiàn)和標(biāo)準(zhǔn)化、專有化。通過VI，將企業(yè)形象傳達(dá)給社會(huì)公眾。視覺識(shí)別系統(tǒng)(VI)又可分為兩大主要方面：一是基礎(chǔ)系統(tǒng)，包括企業(yè)名稱、品牌標(biāo)志、標(biāo)準(zhǔn)字體、印刷字體、標(biāo)準(zhǔn)圖形、標(biāo)準(zhǔn)色彩(宣傳口號(hào)、經(jīng)營報(bào)告書和產(chǎn)品說明書等八大要素;二是應(yīng)用系統(tǒng)。它至少包括十大要素，即產(chǎn)品及其包裝、生產(chǎn)環(huán)境和設(shè)備。展示場所和器具、交通運(yùn)輸工具、辦公設(shè)備和用品、工作服及其飾物、廣告設(shè)施和視聽資料、公關(guān)用品和禮物、廠旗和廠徽、指示標(biāo)識(shí)和路牌等等。

NEC與日本國立大學(xué)法人東京工業(yè)大學(xué)工學(xué)院奧富正敏教授、田中正行特定副教授的研究團(tuán)隊(duì)(以下簡稱東京工業(yè)大學(xué))共同開發(fā)了“多模(注1)圖像融合技術(shù)”，通過AI技術(shù)將一般攝像頭拍攝的可見光圖像與熱成像相機(jī)拍攝的非可見光圖像進(jìn)行自動(dòng)高效合成，且提高了單個(gè)圖像拍攝時(shí)的視覺識(shí)別度。

在需要瞬時(shí)視覺識(shí)別的各個(gè)領(lǐng)域中利用此項(xiàng)技術(shù)，即便在惡劣條件下也可以實(shí)現(xiàn)正確判斷。例如，夜間或濃霧等惡劣天氣條件下也可以正常進(jìn)行的設(shè)施監(jiān)控;即便迎面行駛汽車的刺眼的車燈及黑暗造成視覺死角也可以使用的自動(dòng)駕駛支持;不僅可以監(jiān)測建筑表面的裂縫，還可以監(jiān)測其內(nèi)部異常的基礎(chǔ)設(shè)施點(diǎn)檢等。

以往想要合成不同種類攝像頭拍攝的圖像需要專家進(jìn)行復(fù)雜的手動(dòng)合成作業(yè)。而此技術(shù)則將各種攝像頭采集的圖像通過AI技術(shù)自動(dòng)高效合成，無需手工操作。并且充分利用可見光圖像和非可見光圖像各自的優(yōu)勢，即便是以往人眼難以看清的場景也可以獲得較高的視覺識(shí)別度。

NEC與東京工業(yè)大學(xué)今后也將繼續(xù)通過產(chǎn)學(xué)合作形式共同研發(fā)支撐各項(xiàng)社會(huì)基礎(chǔ)設(shè)施安心安全運(yùn)轉(zhuǎn)的圖像處理以及AI相關(guān)技術(shù)。

【背景】

近年來，在圖像傳感器的不斷升級(jí)及成本持續(xù)下降的背景下，將熱成像攝像頭及可捕捉物體內(nèi)部構(gòu)造的X光?太赫茲波?毫米波攝像頭等非可見光攝像頭應(yīng)用到夜間、濃霧等惡劣天氣、逆光、遮蔽等不利條件下的監(jiān)控及診斷的情況越來越普及。但是這些非可見光攝像頭比可見光攝像頭的分辨率和畫質(zhì)都要低，視覺識(shí)別起來很困難，因此需要將可見光攝像頭與之配合在一起使用，通過對比雙方的圖像進(jìn)行監(jiān)視和診斷。因此，想要快速精準(zhǔn)地判斷對象物體的狀況是比較困難的。為解決這個(gè)課題，最好的辦法就是將兩種圖像合成一個(gè)圖像，但是過去的合成辦法需要精通攝像頭和攝影環(huán)境的專家親自手動(dòng)調(diào)整，從各自單獨(dú)的圖像中抽取出適于合成的部分，一邊注意防止過度曝光和曝光不足以及噪點(diǎn)增強(qiáng)破壞圖像等問題，一邊進(jìn)行復(fù)雜的圖像合成作業(yè)。另外，在非可見光中包含的用于判斷異常及危險(xiǎn)物的特征很可能因?yàn)楹铣稍斐蓙G失，這也是一個(gè)重要課題。

NEC與東京工業(yè)大學(xué)通過學(xué)習(xí)了專家的變換技能的AI技術(shù)，將可見光攝像頭與非可見光攝像頭拍攝的圖像自動(dòng)高效統(tǒng)合，提高對象物?狀況的視覺識(shí)別度，共同開發(fā)了即便在惡劣環(huán)境下也可以快速判斷是否存在異?；蛭ｋU(xiǎn)物的“多模圖像融合技術(shù)”。

圖1：本技術(shù)適用例(注2)

【新技術(shù)的優(yōu)點(diǎn)】

AI技術(shù)自動(dòng)從多個(gè)圖像中選擇出視覺識(shí)別度高的圖像，并在強(qiáng)調(diào)非可見光中包含的細(xì)小特征的同時(shí)進(jìn)行圖像合成，從而實(shí)現(xiàn)打破以往局限性的高度視覺識(shí)別。

AI技術(shù)會(huì)根據(jù)熱成像攝像頭、太赫茲攝像頭等攝像頭種類、環(huán)境特征(亮度、光線方向、有無障礙物)等不同條件，對圖像內(nèi)各部分的視覺識(shí)別度的高低進(jìn)行評(píng)價(jià)，從而從各個(gè)圖像中自動(dòng)抽取出最適宜的部分。

此外，AI技術(shù)在處理非可見光攝像頭拍攝的圖像時(shí)，會(huì)針對異常及危險(xiǎn)物的細(xì)小特征進(jìn)行解析，進(jìn)行適當(dāng)?shù)膹?qiáng)弱調(diào)整以避免因過度曝光及曝光不足而破壞圖像，從而自動(dòng)生成以往無法實(shí)現(xiàn)的高視覺識(shí)別度的多模(可見光-非可見光)融合圖像。

(注1) Multimodal(多模)

多種模式、形態(tài)。本文中提到的多模是指可見光攝像頭拍攝的圖像和紅外線攝像頭等非可見光攝像頭拍攝的圖像。

(注2) 獲得創(chuàng)新研發(fā)推進(jìn)項(xiàng)目(ImPACT)Tough Robotics Challenge關(guān)于惡劣環(huán)境模擬設(shè)備的許可并使用。