簡單來說,「誰在看誰」的概念已經(jīng)出現(xiàn)反轉(zhuǎn)。 在嵌入式視覺的世界,關(guān)鍵主體不是想拍出更加照片的你或是攝影師們,為嵌入式系統(tǒng)而開發(fā)的技術(shù)要「看」的對象是你、它們要識別你是誰、分析你的行為,然后處理那些它們認為你會需要的資料。
可能在你的認知里,這些技術(shù)就是「機器視覺」或是「電腦視覺」;也許沒錯,但坦白說,目前有一些利用嵌入式視覺技術(shù)來執(zhí)行的市場行銷策略,令人頗感不安。 當(dāng)然,這類市場行銷手法不至于像是美國國家安全局(NSA)的電子監(jiān)聽那么恐怖,但該種技術(shù)基本上就是有一堆感測器在監(jiān)視我,目標就是要賺我的錢──這實在讓我覺得毛骨悚然。
我最近在日本東京與一家美國嵌入式視覺技術(shù)開發(fā)商CogniVue 的業(yè)務(wù)發(fā)展副總裁Tom Wilson見面;他告訴我,像CogniVue那樣的視覺處理技術(shù)開發(fā)業(yè)者,目標市場不會只是汽車應(yīng)用。 以下是Wilson所分享的幾個嵌入式視覺技術(shù)應(yīng)用案例:
˙當(dāng)駕駛?cè)嗽诤诎祷臎龅牡缆飞祥_車,(平常是關(guān)閉的)路燈會在汽車行進到前方時開啟,當(dāng)它們感應(yīng)到汽車已經(jīng)離開就會再度關(guān)閉。
˙當(dāng)你從一個數(shù)位看板──也就是公共場所的大型電子顯示器──前方走過,那個螢?zāi)簧踔習(xí)谀阕⒁獾剿?,就可以辨別出你的性別與年齡,然后快速變換所顯示的廣告訊息,以迎合你所屬的人口族群喜好、吸引你的目光。
˙智慧型手機可識別你的手勢,或者是支援人臉識別協(xié)助你標記影像(通知你那個你正在看的人是誰、或是你所拍的照片里有那些人,還會上傳到社群網(wǎng)站)。
˙有一雙「眼睛」的機上盒,會觀察你家客廳、識別出誰在看哪些電視節(jié)目,然后將那些資訊傳送到后端伺服器,在你正在看的節(jié)目里置入你會有興趣的數(shù)位產(chǎn)品廣告。
在以上幾個案例里面,最吸引我注意的就是最后那種「有眼睛的機上盒」;當(dāng)然,因為知道微軟(Microsoft) Xbox 360游戲機的體感識別裝置Kinect ,這種技術(shù)或許不那么令人驚訝,但我就是很想進一步了解它的運作原理。
對此Wilson的解釋是:「那就是說,如果你正在看美國影集《Friends》,那臺機上盒會知道是你在看,然后知道你喜歡的是可口可樂而不是百事可樂?!褂谑呛蠖说乃欧髂芤詳?shù)位化的方式,把影集中人物正在使用的置入性行銷產(chǎn)品,換成你喜歡的那種。
Wilson指出,有一家廣告平臺開發(fā)商Mirriad,就是專門提供這樣的解決方案:「他們的方案就是將置入性廣告類型與觀眾的喜好搭配?!垢鶕?jù)他的說法,該種「有眼睛的機上盒」并不是一個牽強的概念,Mirriad這家公司最近已經(jīng)與機上盒供應(yīng)商Pace簽署合作協(xié)議,要在英國試用這種解決方案。
在解釋何謂數(shù)位廣告置入性行銷方案時,Wilson開玩笑地表示,這就是他家沒有電視的原因之一;但他也讓我理解了那些嵌入式視覺應(yīng)用帶來的深遠影響,以及嵌入式視覺IP (包括軟體與硬體)供應(yīng)商之間的競爭,在近幾年來有越演越烈的趨勢。
CogniVue、Mobileye、 CEVA 與Tensilica (現(xiàn)已收歸Cadence 旗下)是目前市場上可提供嵌入式視覺技術(shù)的幾家IP供應(yīng)商,Imagination Technology 最近也藉由發(fā)表PowerVR Raptor ISP (image signal processing,影像訊號處理)技術(shù)成為該領(lǐng)域的新競爭者。
其他晶片大廠包括Freescale、TI與ST也有推出特殊應(yīng)用視覺處理器產(chǎn)品,但通常是與業(yè)界伙伴合作,或是與嵌入式視覺IP供應(yīng)商簽屬授權(quán)協(xié)議。
目前汽車應(yīng)用是各種視覺處理器的主戰(zhàn)場,因為嵌入式視覺在先進駕駛?cè)溯o助系統(tǒng)(ADAS)內(nèi)扮演要角;汽車廠商正指望ADAS帶來新商機,大力宣傳該系統(tǒng)可提供的各種安全功能如車道偏離警告、撞擊緩解(collision mitigation)、自動停車,以及盲點提醒等等。
根據(jù)市場研究機構(gòu)IHS的估計,特殊應(yīng)用視覺處理器在汽車市場的應(yīng)用規(guī)模,2013年可達到1.51億美元;該數(shù)字在2012年為1.37億美元,在2011年則為1.26億美元。
仍有待克服的市場障礙
不過目前產(chǎn)業(yè)界其實仍只看到嵌入式視覺的表面;如嵌入式視覺聯(lián)盟(Embedded Vision Alliance)創(chuàng)辦人Jeff Bier先前接受EETimes 美國版訪問時所言:「視覺處理仍有許多非常困難的問題有待解決,就算人們花費大量的時間開發(fā)了一系列嵌入式視覺演算法 ?!?/p>
CogniVue 的Wilson也同意以上看法,他指出,要處理大量的即時資料需要非常密集的運算性能,而要以一個強健的方式架構(gòu)出「3D感測器映像圖(3D sensor map)」,特別是在訴求低功耗的消費性電子裝置中,更是艱難任務(wù)。 Wilson解釋,所謂的「3D感測器映像圖」是解決目前2D電腦視覺基本限制的關(guān)鍵。
舉例來說,2D技術(shù)在影像分割(segmentation,也就是分開背景與前景)、照度(illumination,支援人臉識別)、相對定位(relative position,辨別畫面中物體相對位置),以及遮蔽(occlusion,識別人臉前方的手)等方面有問題,而不同3D感測方案都面臨性能上的折衷。 Wilson表示,CogniVue現(xiàn)在正試圖透過演算法解決映像圖問題,以催生低成本3D感測器視覺方案。
對系統(tǒng)設(shè)計工程師來說,要設(shè)計出能有效執(zhí)行不同視覺演算法的硬體,是很大的挑戰(zhàn);那些正在尋找影像/視訊處理解決方案的系統(tǒng)供應(yīng)商,可選擇把所有任務(wù)留在CPU里面、將影像任務(wù)交給GPU,或是添加專門處理影像的硬體邏輯。
隨著像Imagination這樣的主流GPU核心供應(yīng)商涉足視覺市場,可預(yù)見相關(guān)IP供應(yīng)商與晶片廠商的競爭將更加激烈。 而我們也可以預(yù)期,未來將會有各種各樣讓人驚艷的嵌入式視覺解決方案出現(xiàn)在日常生活中…拭目以待那個「美麗新世界」吧!
編譯: Judith Cheng
(參考原文: Embedded Vision: Who's Watching Whom & Why ,by Junko Yoshida)