硅谷就像個圍城。在硅谷待久了,會產(chǎn)生一種感覺,那就是一切機器都在變得像人。
先是亞馬遜推出Echo,成為一個家里隨時能跟你對話,幫你查天氣、訂餐廳的機器管家。
現(xiàn)在,這家叫做Eyeris的人工智能公司告訴我, 亞馬遜的下一代Echo智能管家產(chǎn)品就將有“眼睛”,它能看見我,讀懂我的表情,并且分析我的心情好壞。
好吧,會察言觀色的機器人終于要出現(xiàn)了。
發(fā)現(xiàn)這家公司,是在AT&T的年度“Shape”大會上。“Shape”是舊金山夏天的科技盛事,技術(shù)宅云集。 在各種日本機器人、韓國機器人、VR、AR硬件的光芒下,做軟件的人工智能公司真的不是很引人注意。
但是,Eyeris提出了一個“看臉”概念。“看臉”是人類認知彼此的方式。我們萍水相逢,我第一眼,肯定是看你的臉,進而猜測你的年齡、種族和心情。 Eyeris的技術(shù),簡單來說,就是教會機器“看臉”。 攝像頭將會變成機器的眼睛,機器將會變得和人一樣聰明,它們會看你,捕捉你的微表情,以及分析你的情緒。
于是,硅谷密探探員造訪了Eyeris, 與Eyeris的CEO JR Alaoui聊了聊人工智能的前沿技術(shù)與趨勢。
Eyeris 創(chuàng)始人、CEO JR Alaoui
Eyeris做人臉識別和情緒分析,從哪一步開始?
2013年,Eyeris召集了數(shù)百名實驗參與者,通過采集他們的面部表情數(shù)據(jù),建起了第一個數(shù)據(jù)庫。
通過給采集的數(shù)百萬個人臉表情分類,標簽,Eyeris形成了機器學(xué)習(xí)的基礎(chǔ)。在此后的數(shù)年,Eyeris不斷進行新的人臉采集,并且結(jié)合不同的環(huán)境、燈光條件,豐富這個數(shù)據(jù)庫、改進算法,形成了通過“看臉”識別人類情緒的技術(shù)。除了教機器識別情緒之外,Eyeris還融入了識別人種 (5 種)、年齡層 (4 種)、性別 (2 種)、頭部位置 (13 種)等能力。
這個技術(shù)怎么用呢?首先,當然是讓機器更像人。
如果我問機器管家,今天天氣怎么樣?目前的技術(shù)或許只能“就事論事”給出答案,就像亞馬遜的Echo一樣。但是,有了“看臉”能力,它將能讀懂我的心情,“審時度勢”的回答,或許客氣一點,或許活潑一點;總之就是get了順著我脾氣走,哄我開心的技能就對了!
這個技能的正式名稱,叫做用于社交機器人(Social Robots)的“臉部分析技術(shù)”。Eyeris的軟件,使社交機器人可以更好地理解人類的行為,包括通過人臉部的微表情,來理解人的情緒,為用戶提供個性化的體驗。
當然,它將不只是用于機器人,也用于各種應(yīng)用程序,只要這個應(yīng)用是裝載在有攝像頭的設(shè)備上,例如手機、平板電腦、無人機、游戲機、汽車等。
試想,在我用iPad看YouTube上的電影時,iPad上的攝像頭能夠追蹤和捕捉我的情緒變化,自動的了解哪些場景讓我笑,哪些故事讓我哭。這對個性化定制內(nèi)容是多么重要啊!
再比如,電視里的一個節(jié)目讓我笑了,我的攝像頭馬上get到我的笑點,而電視臺則立馬根據(jù)收到的數(shù)據(jù)給我推送一個同類節(jié)目。
這個讓我更開心的世界還有多久會誕生? JR Alaoui 告訴我, Eyeris預(yù)測在不到12個月的時間里,我們就會看到情緒識別的軟件被大量的安裝在有攝像頭的社交機器人上,與各種應(yīng)用程序結(jié)合。而這些具有情緒識別能力的設(shè)備,價格將比我想象的低,只要300到500美元。12個月?好吧,我們拭目以待吧!
然而,這個技術(shù)更要緊的是能救命。
5月份,特斯拉自動駕駛汽車的那場車禍,鬧得人心不寧。目前,美國的自動駕駛技術(shù)分為四個級別。最高級別是谷歌的自動駕駛汽車,完全不需要司機。但時,這要求路面基礎(chǔ)設(shè)施也達到很高的水平,所以在10至15年內(nèi)都不可能大面積商用。而現(xiàn)在最普遍的,是準自動駕駛汽車,即必須有駕駛員,而車輛的操縱可以隨時在駕駛員手動和汽車自動模式間轉(zhuǎn)換。
Eyeris的基于微表情的情緒識別技術(shù),可以用來監(jiān)測司機的狀態(tài),例如眼睛是否睜開,姿態(tài)是否適于開車,情緒是否穩(wěn)定,注意力是否集中等。 如果發(fā)現(xiàn)司機困的睡著了,或是狀態(tài)很不好,Eyeris會觸發(fā)汽車的應(yīng)對機制,例如通過聲音或座椅的震動來提醒駕駛員,勒緊安全帶。
這對于準自動駕駛汽車,是個重要的應(yīng)用。在司機狀態(tài)不好時,攝像頭及時識別,提醒司機,或者將汽車轉(zhuǎn)入自動駕駛模式,避免掉很多風(fēng)險。
面對駕駛員的攝像頭會以每秒200幀的速度持續(xù)的觀察司機。 夜間光線不好,或者駕駛員戴了又大又黑的墨鏡也沒問題,通過紅外識別攝像頭也可以看清一切。
準自動駕駛汽車從自動模式轉(zhuǎn)為手動模式時,這個技術(shù)也能增加一層保障。攝像頭會通過識別司機是否注意力集中,精神狀態(tài)良好,眼睛是否在查看前方路況,來建議是否應(yīng)該把駕駛權(quán)交還給司機。
在Eyeris之前, CEO JR Alaoui經(jīng)營著另一家公司。這家公司為廣布于機場、購物中心等處的電視墻網(wǎng)絡(luò)提供解決方案,通過電視墻上的攝像頭,來觀察走近電視墻的人的特征,從而推送個性化的廣告。例如,一位女士在逛商場時走近電視墻,電視墻上的攝像頭和計算機察覺到了,就會自動播歐萊雅的廣告。
理念上,這和JR Alaoui現(xiàn)在的人工智能公司很像。但JR Alaoui進入情緒識別領(lǐng)域,還是從2010年左右開始。那段時間,JR Alaoui遇到了Eyeris的另一位創(chuàng)始人,后來的CTO Steven Cadavid。Steven Cadavid是邁阿密大學(xué)計算機視覺博士,在情緒識別方面有著很強的而背景,是將機器學(xué)習(xí)應(yīng)用于臉部識別的第一批研究者之一。
JR Alaoui雖然大學(xué)是學(xué)整合營銷的,但他對人工智能、計算機視覺興趣濃厚,自學(xué)成才。在這兩個牛人的帶領(lǐng)下,Eyeris公司13個人的團隊,開發(fā)出了基于SDK的整套的臉部分析軟件,該軟件結(jié)合深度學(xué)習(xí)技術(shù),可以被安裝到硬件、攝像頭、操作系統(tǒng),也可以置于芯片上。
JR Alaoui表示,目前還沒有其他公司能夠把整套的臉部分析軟件融入一個SDK中。并且,Eyeris的軟件可以置于任何硬件,應(yīng)用范圍非常廣。
目前Eyeris的商業(yè)模式主要是授權(quán)自己的技術(shù)給硬件制造商,例如汽車制造商、電子設(shè)備制造商,攝像頭廠商等。另外,Eyeris也與芯片制造商合作,將軟件裝在芯片上,用于有攝像功能的設(shè)備。
如果說目前還有什么挑戰(zhàn),那主要是硬件方面。能達到要求,價格又低廉的攝像頭,和能支持軟件高速運轉(zhuǎn)的硬件,是Eyeris推進自己技術(shù)商業(yè)化應(yīng)用的兩大挑戰(zhàn)。紅外攝像頭可以追蹤人的動作,但是并不適合于微表情的識別。而JR Alaoui希望,高質(zhì)量的3D攝像頭可以加速發(fā)展,很快被應(yīng)用起來。
另外,環(huán)境的變化也影響表情識別的準確度。雖然Eyeris搜集了各種環(huán)境下的人臉表情,建立了龐大的數(shù)據(jù)庫,但總是有新的環(huán)境情況出現(xiàn),例如夜店,例如光線變化快速的晚會。在普通情況下,Eyeris的表情識別準確度能達到98%,但在這些情況下,就有所降低了。
甄嬛娘娘般的人工智能會不會出現(xiàn)?
在AT&T Shape上,JR Alaoui 談到了一個未來的愿景:無處不在的人工智能。
不遠的未來,電子設(shè)備會無處不在,不管你是否察覺的到它們;而每一個電子設(shè)備,都與可識別人情緒的攝像頭與人工智能軟件結(jié)合。
在人工智能無處不在的世界里,我晚上加班回家再也不用擔心黑燈瞎火,因為快到家時,房間就會根據(jù)我今天的心情亮好燈,放好音樂。我也不用擔心看電視節(jié)目無聊,因為電視也會察言觀色了,根據(jù)我喜歡看什么,給我推薦節(jié)目。而這一切,不需要我動一根指頭說一句話,人工智能妥妥的心知肚明。
很像家有甄嬛娘娘吧?