看電視?其實(shí)電視也想看你!
簡單來說,“誰在看誰”的概念已經(jīng)出現(xiàn)反轉(zhuǎn)。在嵌入式視覺的世界,關(guān)鍵主體不是想拍出更加照片的你或是攝影師們,為嵌入式系統(tǒng)而開發(fā)的技術(shù)要“看”的對象是你、它們要識別你是誰、分析你的行為,然后處理那些它們認(rèn)為你會(huì)需要的資料。
可能在你的認(rèn)知里,這些技術(shù)就是“機(jī)器視覺”或是“計(jì)算機(jī)視覺”;也許沒錯(cuò),但坦白說,目前有一些利用嵌入式視覺技術(shù)來執(zhí)行的市場行銷策略,令人頗感不安。當(dāng)然,這類市場營銷手法不至于像是美國國家安全局(NSA)的電子監(jiān)聽那么恐怖,但該種技術(shù)基本上就是有一堆傳感器在監(jiān)視我,目標(biāo)就是要賺我的錢──這實(shí)在 讓我覺得毛骨悚然。
我最近在日本東京與一家美國嵌入式視覺技術(shù)開發(fā)商CogniVue 的業(yè)務(wù)發(fā)展副總裁Tom Wilson見面;他告訴我,像CogniVue那樣的視覺處理技術(shù)開發(fā)業(yè)者,目標(biāo)市場不會(huì)只是汽車應(yīng)用。以下是Wilson所分享的幾個(gè)嵌入式視覺技術(shù)應(yīng)用案例:
●當(dāng)駕駛?cè)嗽诤诎祷臎龅牡缆飞祥_車,(平常是關(guān)閉的)路燈會(huì)在汽車行進(jìn)到前方時(shí)開啟,當(dāng)它們感應(yīng)到汽車已經(jīng)離開就會(huì)再度關(guān)閉。
●當(dāng)你從一個(gè)數(shù)字看板──也就是公共場所的大型電子顯示器──前方走過,那個(gè)屏幕甚至?xí)谀阕⒁獾剿?,就可以辨別出你的性別與年齡,然后快速變換所顯示的廣告消息,以迎合你所屬的人口族群喜好、吸引你的目光。
●智能手機(jī)可識別你的手勢,或者是支持人臉識別協(xié)助你標(biāo)記影像(通知你那個(gè)你正在看的人是誰、或是你所拍的照片里有那些人,還會(huì)上傳到社群網(wǎng)站)。
●有一雙“眼睛”的機(jī)頂盒,會(huì)觀察你家客廳、識別出誰在看哪些電視節(jié)目,然后將那些信息傳送到后端服務(wù)器,在你正在看的節(jié)目里置入你會(huì)有興趣的數(shù)字產(chǎn)品廣告。
在以上幾個(gè)案例里面,最吸引我注意的就是最后那種“有眼睛的機(jī)頂盒”;當(dāng)然,因?yàn)橹牢④?Microsoft) Xbox 360游戲機(jī)的體感識別裝置 Kinect ,這種技術(shù)或許不那么令人驚訝,但我就是很想進(jìn)一步了解它的運(yùn)作原理。
對此Wilson的解釋是:“那就是說,如果你正在看美劇《Friends》,那臺機(jī)頂盒會(huì)知道是你在看,然后知道你喜歡的是可口可樂而不是百事可樂?!庇谑呛蠖说姆?wù)器能以數(shù)字化的方式,把影集中人物正在使用的植入性營銷產(chǎn)品,換成你喜歡的那種。
Wilson 指出,有一家廣告平臺開發(fā)商Mirriad,就是專門提供這樣的解決方案:“他們的方案就是將置入性廣告類型與觀眾的喜好搭配。”根據(jù)他的說法,該種“有 眼睛的機(jī)頂盒”并不是一個(gè)牽強(qiáng)的概念,Mirriad這家公司最近已經(jīng)與機(jī)頂盒供貨商Pace簽署合作協(xié)議,要在英國試用這種解決方案。
在解釋何謂數(shù)字廣告植入性營銷方案時(shí),Wilson開玩笑地表示,這就是他家沒有電視的原因之一;但他也讓我理解了那些嵌入式視覺應(yīng)用帶來的深遠(yuǎn)影響,以及嵌入式視覺IP (包括軟件與硬件)供貨商之間的競爭,在近幾年來有越演越烈的趨勢。
CogniVue、 Mobileye、 CEVA 與 Tensilica (現(xiàn)已收歸Cadence 旗下)是目前市場上可提供嵌入式視覺技術(shù)的幾家IP供貨商,Imagination Technology 最近也藉由發(fā)表PowerVR Raptor ISP (image signal processing,影像信號處理)技術(shù)成為該領(lǐng)域的新競爭者。
其它芯片大廠包括Freescale、TI與ST也有推出特殊應(yīng)用視覺處理器產(chǎn)品,但通常是與業(yè)界伙伴合作,或是與嵌入式視覺IP供貨商簽屬授權(quán)協(xié)議。
目 前汽車應(yīng)用是各種視覺處理器的主戰(zhàn)場,因?yàn)榍度胧揭曈X在先進(jìn)駕駛?cè)溯o助系統(tǒng)(ADAS)內(nèi)扮演要角;汽車廠商正指望ADAS帶來新商機(jī),大力宣傳該系統(tǒng)可 提供的各種安全功能如車道偏離警告、撞擊緩解(collision mitigation)、自動(dòng)停車,以及盲點(diǎn)提醒等等。
根據(jù)市場研究機(jī)構(gòu)IHS的估計(jì),特殊應(yīng)用視覺處理器在汽車市場的應(yīng)用規(guī)模,2013年可達(dá)到1.51億美元;該數(shù)字在 2012年為1.37億美元,在2011年則為1.26億美元。
仍有待克服的市場障礙
不過目前產(chǎn)業(yè)界其實(shí)仍只看到嵌入式視覺的表面;如嵌入式視覺聯(lián)盟(Embedded Vision Alliance)創(chuàng)辦人Jeff Bier先前接受EETimes 美國版訪問時(shí)所言:“視覺處理仍有許多非常困難的問題有待解決,就算人們花費(fèi)大量的時(shí)間開發(fā)了一系列嵌入式視覺算法?!?BR>
CogniVue 的Wilson也同意以上看法,他指出,要處理大量的實(shí)時(shí)數(shù)據(jù)需要非常密集的運(yùn)算性能,而要以一個(gè)強(qiáng)健的方式架構(gòu)出“3D傳感器映像圖(3D sensor map)”,特別是在訴求低功耗的消費(fèi)性電子裝置中,更是艱難任務(wù)。Wilson解釋,所謂的”3D傳感器映像圖”是解決目前2D計(jì)算機(jī)視覺基本限制的關(guān)鍵。
舉例來說,2D技術(shù)在影像分割(segmentation,也就是分開背景與前景)、照度(illumination, 支持人臉識別)、相對定位(relative position,辨別畫面中物體相對位置),以及遮蔽(occlusion,識別人臉前方的手)等方面有問題,而不同3D感測方案都面臨性能上的折衷。 Wilson表示,CogniVue現(xiàn)在正試圖透過算法解決映像圖問題,以催生低成本3D傳感器視覺方案。
對系統(tǒng)設(shè)計(jì)工程師來說,要設(shè)計(jì)出能有效執(zhí)行不同視覺算法的硬件,是很大的挑戰(zhàn);那些正在尋找影像/視頻處理解決方案的系統(tǒng)供貨商,可選擇把所有任務(wù)留在CPU里面、將影像任務(wù)交給GPU,或是添加專門處理影像的硬件邏輯。
隨著像Imagination這樣的主流GPU核心供貨商涉足視覺市場,可預(yù)見相關(guān)IP供貨商與芯片廠商的競爭將更加激烈。而我們也可以預(yù)期,未來將會(huì)有各種各樣讓人驚艷的嵌入式視覺解決方案出現(xiàn)在日常生活中…拭目以待那個(gè)“美麗新世界“吧!