當(dāng)前位置:首頁 > 公眾號(hào)精選 > Techsugar
[導(dǎo)讀]自從技術(shù)出現(xiàn)以來,對(duì)技術(shù)的道德恐慌就一直是人類體驗(yàn)的一部分。而人類科技所帶來的信息共享,正有逐步讓人類打消對(duì)隱私的顧慮,習(xí)慣透明化生存,以及將人體作為物聯(lián)網(wǎng)終端一部分的趨勢(shì)。

自從技術(shù)出現(xiàn)以來,對(duì)技術(shù)的道德恐慌就一直是人類體驗(yàn)的一部分。而人類科技所帶來的信息共享,正有逐步讓人類打消對(duì)隱私的顧慮,習(xí)慣透明化生存,以及將人體作為物聯(lián)網(wǎng)終端一部分的趨勢(shì)。

數(shù)據(jù)研究者稱 2020 年,語音交互將占據(jù) 50% 的搜索入口。Amazon Alexa和Google助手等語音助手,AIOT, 車載助理,智能音箱... 在目前人類科技樹上,“語音交互” (Voice interaction) 已然成為必點(diǎn)技能之一。然而在各種場(chǎng)景下,人們嘗試通過“自然語言”重新與冰冷的機(jī)器對(duì)話,但往往效果不及預(yù)期。

語音識(shí)別技術(shù)大概經(jīng)歷過三個(gè)階段,從匹配聲紋和聲波到下達(dá)命令,面臨很難進(jìn)行統(tǒng)一地語法規(guī)律,識(shí)別的錯(cuò)誤率很高的挑戰(zhàn),一直到依托于算力和大數(shù)據(jù),通過神經(jīng)網(wǎng)絡(luò)來建立更復(fù)雜的這種語音識(shí)別模型。

VUI(Voice User Interface,語音用戶界面)正是在第三階段快速發(fā)展的新領(lǐng)域。VUI對(duì)用戶體驗(yàn)提出了更多關(guān)于語言學(xué)、情感塑造、邏輯搭建等方面的新要求。

語音技術(shù),越來越多地用于智能家居控制、樓宇自動(dòng)化、智能零售、聯(lián)接的汽車、醫(yī)療等物聯(lián)網(wǎng)垂直領(lǐng)域。而語音識(shí)別和自然語言處理技術(shù)是VUI的基礎(chǔ)。

“千箱大戰(zhàn)”退潮,智能語音交互持續(xù)進(jìn)化


人類傳統(tǒng)的交互單一通道有眼(視覺系統(tǒng))、耳(聽覺系統(tǒng))、口(味覺系統(tǒng))、鼻(嗅覺系統(tǒng))、手(觸覺系統(tǒng))等器官,在這些通道彼此融合后,人機(jī)交互技術(shù)正從鍵盤鼠標(biāo)變成了觸屏,又轉(zhuǎn)變成現(xiàn)在的語音視覺等多模態(tài)交互。具體表現(xiàn)為從“手指”優(yōu)先,發(fā)展為“語音”優(yōu)先。語音交互技術(shù)兼顧老人、兒童以及方言人士讓語音對(duì)話體驗(yàn)越來越好。語音與視覺,觸屏,LCD反饋顯示結(jié)合的交互體驗(yàn),令交互門檻的不斷降低。


VUI是用戶通過語音或者語音平臺(tái)與計(jì)算機(jī)進(jìn)行人機(jī)交互,來啟動(dòng)自動(dòng)化服務(wù)或流程。VUI設(shè)計(jì),即用戶與語音應(yīng)用系統(tǒng)的交互設(shè)計(jì)。VUI是直接面向用戶的界面,所以是否能滿足用戶需求是系統(tǒng)成功與否的決定性因素之一。


VUI各種場(chǎng)景下對(duì)聲音信息的收集帶來了便利,個(gè)性化推送、定制服務(wù)都不再高端,逐漸平民化,提高了社會(huì)運(yùn)行效率,降低時(shí)間與商家的營(yíng)銷成本。



VUI將成為私人助理


一個(gè)行業(yè),如果有爆發(fā)式的增長(zhǎng),一定是打中了被壓制的需求。聲音的價(jià)值在于便利性和情境性或者情感性,VUI正是戳中了別的交互技術(shù)所不能達(dá)到的情境性。



Siri淑女、微軟小冰的童真可愛、小愛同學(xué)的青春靚麗,商家主動(dòng)打造VUI虛擬角色、樹立不同人格特質(zhì)供用戶選擇。


VUI技術(shù)的發(fā)展將更容易為人們提供量身定制的數(shù)字體驗(yàn),它不但能成為人們的私人助理,了解人的需求,還能超前預(yù)測(cè)需求。它能涉及到你生活的方方面面,甚至是你想象不到的領(lǐng)域。


聲音承載的信息特性是能包含更多感情信息。因?yàn)樾枰€(wěn)定易理解的文字信息所以更需要語音識(shí)別,只是強(qiáng)調(diào)語音清晰還不夠用。但其實(shí)無論是Siri還是微軟小冰,語音呈現(xiàn)模仿人類的語言情感仍不算非常理想,“機(jī)器味兒”重。



VUI 的設(shè)計(jì)趨勢(shì)


衡量語音交互的質(zhì)量也不再局限于識(shí)別的準(zhǔn)確率,而是更側(cè)重垂直場(chǎng)景下的語義理解,以及后端的內(nèi)容服務(wù)。


讓智能語音交互實(shí)現(xiàn)“真”智能

未來的語音交互終端需要理解“千人千面”,即使對(duì)面是一臺(tái)機(jī)器,它不僅懂你聲音的語義,也懂你的情感和訴求。


聲音承載的信息本身,信息密度不高,而且人類主要依賴視覺信息。聲音信息(生物特征識(shí)別)本身的價(jià)值,比較有限,應(yīng)用也很有限。說話聲音的粗細(xì)音調(diào)高低語言習(xí)慣,這些在刑偵領(lǐng)域、安防技術(shù)領(lǐng)域有應(yīng)用。無障礙設(shè)計(jì),創(chuàng)建可用不同方式呈現(xiàn)的內(nèi)容(例如簡(jiǎn)單的布局),而不會(huì)丟失信息或結(jié)構(gòu)。


追求的一種自然、親切的交互方式,使產(chǎn)品“帶有情感和溫度的交互體驗(yàn)”,真正的從用戶角度出發(fā)。


消除使用者的認(rèn)知負(fù)荷

聲音信息的價(jià)值被注意到,但是如何利用和維護(hù)是個(gè)問題。


一方面,目前缺乏監(jiān)管、缺乏法律對(duì)于聲音信息收集的約束(其實(shí)對(duì)于隱私收集,全世界范圍內(nèi)都缺乏成熟的法律法規(guī)),導(dǎo)致聲音信息收集被濫用。另一方面,一些打著科技讓生活更美好的幌子的企業(yè)們干起了用戶信息灰色交易、大數(shù)據(jù)殺熟等等勾當(dāng)。

19年南京建環(huán)給環(huán)衛(wèi)工配發(fā)智能手環(huán)


更敏感的,是公權(quán)力對(duì)于聲音信息的收集是否對(duì)于公民權(quán)利構(gòu)成侵犯。對(duì)于公權(quán)力法無授權(quán)地侵犯,法律似乎沒有明確這方面的界限。


消除使用者的認(rèn)知負(fù)荷,是VUI技術(shù)持續(xù)發(fā)展亟待解決的問題。



協(xié)同圖形用戶界面(GUI)


語音、視覺、觸控加上反饋的融合是未來的方向。建立GUI+VUI協(xié)作機(jī)制,可打造更多智慧體驗(yàn)。


GUI的內(nèi)容主要為圖形和文字;VUI的內(nèi)容主要為文字。人們主要通過點(diǎn)擊和手勢(shì)的方式與GUI進(jìn)行交互,人們通過對(duì)話的方式與VUI進(jìn)行交互。VUI要給出正確的響應(yīng)事件必須要先理解人類在說什么,更重要的是在想什么。


例如Siri、Google Assistant、Cortana、Bixby,以及Alexa屏幕版。在GUI的基礎(chǔ)上增加VUI有助于簡(jiǎn)化整個(gè)導(dǎo)航的交互,可以做到無直接關(guān)系頁面的跳轉(zhuǎn),例如以命令的形式導(dǎo)航去其他應(yīng)用的某個(gè)頁面。在VUI的基礎(chǔ)上增加GUI可以使選擇、確認(rèn)等操作得以簡(jiǎn)化,尤其是用Alexa進(jìn)行購物時(shí)。




智能語音是未來最重要的交互入口,但目前語音交互仍沒有成為主流的人機(jī)交互手段。除了技術(shù)上人工智能還未特別“智能”,還有一部分來源于人們的認(rèn)知負(fù)荷。


自從技術(shù)出現(xiàn)以來,對(duì)技術(shù)的道德恐慌就一直是人類體驗(yàn)的一部分。


人類科技所帶來的信息共享,正有逐步讓人類打消對(duì)隱私的顧慮,習(xí)慣透明化生存,以及將人體作為物聯(lián)網(wǎng)終端一部分的趨勢(shì)。



更多精彩

電動(dòng)汽車電池剩余電量不準(zhǔn)惹的禍 里程焦慮如何拯救?

【典型新舊造車勢(shì)力大盤點(diǎn)】彩虹總現(xiàn)風(fēng)雨后 當(dāng)把新桃換舊符

自動(dòng)駕駛方案的安全風(fēng)險(xiǎn)化解之道

優(yōu)化襯底助推第三代半導(dǎo)體實(shí)現(xiàn)汽車創(chuàng)新

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉