語(yǔ)音助手的發(fā)展將改變用戶的生活方式
(文章來(lái)源:百家號(hào))
? ? ? ?汽車(chē)的發(fā)展也是越來(lái)越迅速了,每一年汽車(chē)行業(yè)都有新東西跟大眾見(jiàn)面,而如今的語(yǔ)音交互技術(shù)也是越來(lái)越好了,而很多人認(rèn)為語(yǔ)音交互只是用語(yǔ)音來(lái)說(shuō)話,這實(shí)際上是一種誤解。語(yǔ)音交互涉及視覺(jué)通道、觸控通道、手勢(shì)通道等多通道結(jié)合,只有將各項(xiàng)技術(shù)整合在一起,才能讓用戶體驗(yàn)逐漸進(jìn)階:
(1)第一步核心是解決安全問(wèn)題,解放雙手,避免視線分散。(2)第二步是提高效率,減少學(xué)習(xí),解放大腦,讓駕乘者對(duì)不同場(chǎng)景及時(shí)反饋。(3)再往上進(jìn)階則講究交互的樂(lè)趣,語(yǔ)音可以非常情感化地與人互動(dòng),而且可以緩解疲勞,是一種精神的享受。
所以語(yǔ)音助手接下來(lái)的發(fā)展方向是衍生出來(lái)更多堵車(chē)、事故預(yù)判及預(yù)警、日常關(guān)懷提醒、疲勞駕駛、緊急信息處理等應(yīng)用場(chǎng)景,進(jìn)一步改變用戶的用車(chē)及生活方式。比如通過(guò)場(chǎng)景化的聲音提示及語(yǔ)音互動(dòng),降低駕駛過(guò)程中的疲勞感,保證行車(chē)安全;通過(guò)情感化的語(yǔ)氣語(yǔ)調(diào)、聲音娛樂(lè)方式,緩解堵車(chē)過(guò)程中用戶的焦躁情緒,減少駕駛安全隱患;當(dāng)用戶注意力集中,雙手被占據(jù)的時(shí)候,通過(guò)語(yǔ)音完成文字內(nèi)容輸入等復(fù)雜任務(wù),通過(guò)聲音獲得操作反饋,保證行車(chē)安全,提高任務(wù)效率。
如果說(shuō)未來(lái)的設(shè)計(jì)趨勢(shì)是管家式體驗(yàn)的話,語(yǔ)音交互對(duì)于汽車(chē)而言,不僅僅是為了帶給用戶更好的任務(wù)操作體驗(yàn),而應(yīng)該在用戶的用車(chē)生活中提供更多的情感化互動(dòng),提供更多的友好性、趣味性,提升用戶的精神愉悅感,包括基于聲紋識(shí)別技術(shù)、方言識(shí)別技術(shù)、語(yǔ)音多輪交互、語(yǔ)義理解技術(shù)等,提升語(yǔ)音交互的準(zhǔn)確性和效率。
通過(guò)對(duì)語(yǔ)言理解的深度學(xué)習(xí)和用戶數(shù)據(jù)分析,針對(duì)不同用戶的語(yǔ)言習(xí)慣、用車(chē)偏好等,增強(qiáng)語(yǔ)音交互體驗(yàn)的個(gè)性化和差異性;未來(lái)的交互甚至可以通過(guò)語(yǔ)音識(shí)別情緒,通過(guò)語(yǔ)音識(shí)別身份,智能化地引發(fā)汽車(chē)的相應(yīng)反應(yīng)。
想要做好這些,車(chē)載語(yǔ)音系統(tǒng)需要提升哪些核心能力?前期在于自然“語(yǔ)言處理(Natural Language Processing)+自然語(yǔ)言理解(Natural Language Understanding)引擎”的能力,后期在于“數(shù)據(jù)和計(jì)算能力+資源整合能力”的提升。過(guò)去常有人說(shuō),車(chē)載語(yǔ)音交互技術(shù)的發(fā)展將會(huì)是一個(gè)緩慢的發(fā)展過(guò)程?,F(xiàn)在看來(lái),至少這一進(jìn)程比預(yù)期來(lái)得要快。并且,隨著核心競(jìng)爭(zhēng)點(diǎn)的逐步轉(zhuǎn)移,聚焦在車(chē)載語(yǔ)音交互的領(lǐng)域,大玩家之間的聯(lián)盟會(huì)越來(lái)越緊密。