當(dāng)前位置:首頁 > 芯聞號 > 充電吧
[導(dǎo)讀]記者消息,7 月 4 號,微軟官方發(fā)布消息,測試版的 SwiftKey(記者按:2016 年,SwiftKey 被微軟收購)中加入了新功能 Puppets,這個(gè)新功能提供了熊貓、恐龍、貓頭鷹等多個(gè)動(dòng)物

記者消息,7 月 4 號,微軟官方發(fā)布消息,測試版的 SwiftKey(記者按:2016 年,SwiftKey 被微軟收購)中加入了新功能 Puppets,這個(gè)新功能提供了熊貓、恐龍、貓頭鷹等多個(gè)動(dòng)物的 3D 形象,還能夠通過 AI 技術(shù)來實(shí)時(shí)反映用戶的表情和頭部動(dòng)態(tài)。

盡管 3D 表情近幾年開始席卷全球,但值得一提的是,人們關(guān)于創(chuàng)建 3D 動(dòng)態(tài)形象的想法,早在十幾年前就已經(jīng)生根發(fā)芽了。

從好萊塢大片中得到的靈感

2005 年左右,運(yùn)動(dòng)追蹤技術(shù)還遠(yuǎn)未達(dá)到成熟階段,即便是在 2009 年上映的《阿凡達(dá)》,也需要演員提前在臉上標(biāo)記特定的小點(diǎn),穿上帶有特制小球的衣服,幫助光學(xué)系統(tǒng)追蹤人臉和身體的動(dòng)作變化,最終精準(zhǔn)地捕捉到人物角色的表情和動(dòng)作。

記者注:上圖為《阿凡達(dá)》劇照

Faceshift 公司(記者注:Faceshift 是一家人臉追蹤技術(shù)公司,2015 年被蘋果公司收購)的聯(lián)合創(chuàng)始人之一 Mark Pauly 表示:

為演員的臉部標(biāo)點(diǎn)是一個(gè)很不錯(cuò)的想法,因?yàn)檫@樣可以幫助簡化運(yùn)動(dòng)追蹤的計(jì)算量。但這需要大量的設(shè)備,還需要花費(fèi)大量的時(shí)間成本。

Mark Pauly 和其他研究者開始尋求新的方法——開始探索如何使用深度感應(yīng)相機(jī)和算法來取代傳統(tǒng)的方法,使面部表情追蹤變得更簡單。而他們的最終目標(biāo)是制作出可以實(shí)時(shí)模仿人類表情的動(dòng)態(tài)數(shù)字形象。

由于人臉總是持續(xù)變化,因此,為了讓機(jī)器可以準(zhǔn)確識別出面部運(yùn)動(dòng),必須讓它識別出在不同環(huán)境或狀態(tài)下的人臉,比如變幻的光線,頭部的旋轉(zhuǎn)角度,人臉的膚色等。接下來就是不斷地訓(xùn)練算法來處理這些面部數(shù)據(jù)信息,然后建立大量的 3D 模型,形成模擬形象。

人臉追蹤技術(shù)從電影走向手機(jī)

在 2013 年開始,蘋果就陸續(xù)收購了 3D 傳感器制造商 PrimeSense、圖像識別公司 ?Perceptio、增強(qiáng)現(xiàn)實(shí)公司 Metaio 和 人臉追蹤技術(shù)公司 Faceshift。從現(xiàn)在看來,這波瘋狂收購的背后,很大一部分原因是蘋果在為推出 iPhone X 做準(zhǔn)備。

2017 年 9 月,蘋果推出了 iPhone X,從外形上來看,除了經(jīng)典 Home 鍵的消失,屏幕頂部還出現(xiàn)了一塊“劉?!眳^(qū)域。

在這塊神秘的黑色劉海之下,內(nèi)置了麥克風(fēng)、揚(yáng)聲器、前置攝像頭,以及包括環(huán)境光傳感器、距離感應(yīng)器、紅外鏡頭、泛光感應(yīng)元件、點(diǎn)陣投影器在內(nèi)的 5 種感應(yīng)器。這 5 種感應(yīng)器組成了原深感攝像頭系統(tǒng)(True Depth Camera ?System),它可以捕捉并分析用戶的面部 3D 結(jié)構(gòu)特征,類似 3D 建模一樣,然后再通過蘋果神經(jīng)引擎(A11 Bionic Neural Engine)即時(shí)處理識別數(shù)據(jù)。

基于原深感攝像頭和神經(jīng)網(wǎng)絡(luò)的支持,3D 版的 Emoji——Animoji 就這樣應(yīng)運(yùn)而生了;用戶可以在使用 iMessage 時(shí)開啟 Animoji 錄制一段不超過 10 秒的小視頻,而 3D 動(dòng)畫形象會同步用戶的表情,而且這個(gè)功能還支持錄音。

雖然,Animoji 只是作為 iMessage 的一個(gè)功能出現(xiàn),但從 3D 動(dòng)畫表情創(chuàng)新的層面上來說,Animoji 可以算得上是開山之作,它讓好萊塢大片中的 3D 人臉追蹤技術(shù)走向了手機(jī)。

在蘋果開始采用 3D 結(jié)構(gòu)光技術(shù)來支持人臉識別和 Animoji 之后,三星、華為、小米等手機(jī)廠商也在不斷努力之后,實(shí)現(xiàn)了這一技術(shù),并打造了屬于自己的“Animoji”,甚至逐漸擺脫了對原深感攝像頭的依賴。

基于深度神經(jīng)系統(tǒng)的 Puppets

與蘋果 Animoji 不同的是,微軟 3D 動(dòng)畫表情 Puppets 的載體不在于系統(tǒng)內(nèi)的短信(iMessage),而是在于第三方軟件 SwiftKey;這款個(gè)性化輸入法基于先進(jìn)流利的預(yù)言推理引擎,能夠進(jìn)行十分快速的輸入操作——微軟預(yù)計(jì),SwiftKey 每周可以節(jié)約總計(jì) 2000 萬個(gè)小時(shí)的打字時(shí)間。

除此之外,Puppets 最大的不同在于,蘋果 Animoji,以及其他許多 3D 動(dòng)態(tài)表情都需要原深感攝像頭的支持,從而掃描人臉的 3D 結(jié)構(gòu)圖來建模,而 Puppets 僅用普通攝像頭也能塑造出實(shí)時(shí) 3D 動(dòng)態(tài)表情。這是因?yàn)?Puppets 的運(yùn)作原理基于一個(gè)由志愿者提供圖片和視頻集成的龐大數(shù)據(jù)庫,微軟通過這個(gè)數(shù)據(jù)庫來訓(xùn)練自己的深度神經(jīng)網(wǎng)絡(luò),從而識別用戶的表情,比如微笑和眨眼,直接進(jìn)行模仿。

用戶可以通過 Puppets 錄制長達(dá) 30 秒的視頻,視頻會實(shí)時(shí)轉(zhuǎn)化為 3D 動(dòng)態(tài)形象,這些小視頻還可以分享到社交媒體或其他平臺上。

微軟產(chǎn)品經(jīng)理 Deepak Paramanand 表示:

我們希望 SwiftKey 用戶在與家人朋友溝通時(shí),除了預(yù)先設(shè)置的 GIF 動(dòng)圖之外,還能有更多的選擇,因此我們創(chuàng)建了 Puppets。人們希望快速打字,SwiftKey 能夠滿足這一點(diǎn);人們也希望以有趣的方式來表達(dá)自己,這一點(diǎn) SwiftKey 現(xiàn)在也能做到了。

記者小結(jié)

從應(yīng)用在 3D 電影中的人臉追蹤技術(shù),到蘋果開先河的 3D 動(dòng)畫表情 Animoji,再到微軟的 Puppets,這些技術(shù)和產(chǎn)品或許有其不足之處,但至少可以清楚地看到它們在隨著迭代而成長。

值得一提的是,目前推出的 Puppets 還只是測試版,而且僅限于 Android 手機(jī);更多關(guān)于 Puppets 的動(dòng)態(tài),記者(公眾號:記者)將會繼續(xù)關(guān)注。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉