當(dāng)前位置:首頁(yè) > 汽車(chē)電子 > 汽車(chē)電子技術(shù)文庫(kù)
[導(dǎo)讀] 一方面,作為最接近自然交互的形式,全雙工已經(jīng)成為智能語(yǔ)音領(lǐng)域的“香餑餑”,各大AI語(yǔ)音巨頭都在積極布局。 另一方面,車(chē)載場(chǎng)景的人機(jī)交互需求也越來(lái)越強(qiáng)烈,在手沒(méi)有被完全解放的情況下,駕駛員

一方面,作為最接近自然交互的形式,全雙工已經(jīng)成為智能語(yǔ)音領(lǐng)域的“香餑餑”,各大AI語(yǔ)音巨頭都在積極布局。

另一方面,車(chē)載場(chǎng)景的人機(jī)交互需求也越來(lái)越強(qiáng)烈,在手沒(méi)有被完全解放的情況下,駕駛員們對(duì)更自由、更隨性、更解放的語(yǔ)音交互有著更強(qiáng)烈的需求,全雙工為應(yīng)用“剛需”。

與普通生活場(chǎng)景不同,車(chē)載環(huán)境的用戶(hù)手動(dòng)操作更加不便捷,而同時(shí)又往往有諸多功能操作(例如關(guān)窗、開(kāi)空調(diào))、生活服務(wù)(例如導(dǎo)航)、娛樂(lè)消遣需求(例如聽(tīng)歌),多樣化需求更需要更連續(xù)的對(duì)話體驗(yàn)——如果每一個(gè)指令都要喚醒口令,不但用戶(hù)體驗(yàn)不佳,從旁觀者看,這種交互方式也頗有些尷尬。

與此同時(shí),有限空間里的司乘對(duì)話,多人對(duì)話與人機(jī)交互疊加,加上駕駛環(huán)境的嘈雜,無(wú)疑對(duì)智能語(yǔ)音提出了更嚴(yán)峻的挑戰(zhàn)。

于是,迫切的用戶(hù)需求加上龐大的商業(yè)價(jià)值空間,以及車(chē)企這些年對(duì)產(chǎn)品創(chuàng)新的渴求,在這場(chǎng)全雙工的鏖戰(zhàn)中,車(chē)載語(yǔ)音場(chǎng)景不出預(yù)料成了玩家競(jìng)逐的焦點(diǎn),全雙工+車(chē)載的“搭配”迎來(lái)廣闊的市場(chǎng)機(jī)會(huì)。例如,不久前的重慶智博會(huì)上,騰訊云小微就聯(lián)合騰訊車(chē)聯(lián)展示全雙工語(yǔ)音交互技術(shù),讓用戶(hù)對(duì)車(chē)載語(yǔ)音助手有了更多的好感和期待。

巨頭鏖戰(zhàn)全雙工,也推動(dòng)“第三空間”競(jìng)逐走向臺(tái)前

目前為止,車(chē)載+全雙工落地應(yīng)用仍處于初期階段,技術(shù)研發(fā)與應(yīng)用適配同步進(jìn)行中。

1、車(chē)載全雙工,巨頭各有玩法姿勢(shì)

微軟在2018年3月底宣布“全雙工語(yǔ)音交互感官”已完成產(chǎn)品化落地,“長(zhǎng)程語(yǔ)音交互成為可能”,到2019年8月,又宣布全雙工語(yǔ)言交互技術(shù)已經(jīng)通過(guò)車(chē)載設(shè)備完成測(cè)試,已經(jīng)有了幾個(gè)測(cè)試合作汽車(chē)廠。

微軟的全雙工語(yǔ)音及其車(chē)載應(yīng)用是小冰項(xiàng)目的延續(xù),第七代微軟小冰的重心之一是實(shí)現(xiàn)車(chē)載商用,逐步由“玩具”轉(zhuǎn)向現(xiàn)實(shí)價(jià)值,車(chē)載無(wú)疑是當(dāng)下最恰當(dāng)?shù)倪x擇。

而百度在押寶AI戰(zhàn)略的大方向下,全雙工技術(shù)的推廣十分積極。今年7月,小度助手升級(jí)的全雙工語(yǔ)音已經(jīng)在小度在家智能音箱產(chǎn)品上使用,且開(kāi)放賦能給更多智能硬件終端。

入局語(yǔ)音交互領(lǐng)域較早的科大訊飛,在2019年5月底發(fā)布了智能物聯(lián)網(wǎng)操作系統(tǒng)iFLYOS 2.0,也在多個(gè)領(lǐng)域開(kāi)始了全雙工交互技術(shù)的應(yīng)用嘗試。

今年8月,重慶智博會(huì)上,騰訊云小微全雙工語(yǔ)音技術(shù)也正式對(duì)外展示。依靠騰訊云小微這些年在語(yǔ)音技術(shù)上的深耕,選擇了最為“剛需”的車(chē)載場(chǎng)景率先落地全雙工交互技術(shù),試圖從最符合用戶(hù)需求的駕駛場(chǎng)景打頭陣,然后進(jìn)行全域拓展。

車(chē)聯(lián)網(wǎng)與AI助手的結(jié)合,也是技術(shù)與生態(tài)基礎(chǔ)上的B+C的搭配,非常符合騰訊在ToB轉(zhuǎn)向過(guò)程中的一貫調(diào)性。

2、技術(shù)推動(dòng)下,第三空間正由概念走向?qū)嵺`

在很久之前,汽車(chē)就被認(rèn)為是家庭、工作之外的“第三空間”,在歐美等汽車(chē)文化濃郁的國(guó)家,車(chē)的第三空間價(jià)值十分明顯。

但在中國(guó),日常出行的屬性仍然占據(jù)大頭,用戶(hù)進(jìn)入車(chē)內(nèi),聽(tīng)音樂(lè)、導(dǎo)航、調(diào)空調(diào)……在不用重復(fù)喚醒的情況下,很自然完成一套操作……把全雙工放到車(chē)載場(chǎng)景中,如果從汽車(chē)角度看,本質(zhì)上是“第三空間”的一種強(qiáng)化。

拋開(kāi)技術(shù),從具體場(chǎng)景實(shí)踐來(lái)看,巨頭們?cè)谌p工領(lǐng)域的布局和競(jìng)爭(zhēng),也在推動(dòng)“第三空間”競(jìng)逐走向臺(tái)前,誰(shuí)能讓用戶(hù)真正體會(huì)到車(chē)上服務(wù)的便利,挖掘這個(gè)空間的用戶(hù)價(jià)值,誰(shuí)就能在車(chē)載場(chǎng)景中實(shí)現(xiàn)商業(yè)突圍,這本身也與汽車(chē)廠商求新、求變、謀求市場(chǎng)增量的需求相吻合。

第三空間的體驗(yàn)塑造,將面對(duì)用戶(hù)痛點(diǎn)的“三重區(qū)分”的挑戰(zhàn)

離開(kāi)汽車(chē)視角,從全雙工技術(shù)視角來(lái)看,其面臨的首要挑戰(zhàn)在于,如何在連續(xù)對(duì)話中還能擁有很高準(zhǔn)確率和響應(yīng)速度。

例如,從已有資料看,騰訊云小微的全雙工語(yǔ)音交互技術(shù),在30秒到90秒的時(shí)間范圍內(nèi)(用戶(hù)自行設(shè)定),一次喚醒即可實(shí)現(xiàn)連續(xù)對(duì)話,過(guò)程中用戶(hù)可以隨時(shí)打斷機(jī)器的回答。

而除了全雙工的特殊能力,騰訊云小微可實(shí)現(xiàn)車(chē)載復(fù)雜噪聲環(huán)境下喚醒率97%以上,語(yǔ)音識(shí)別準(zhǔn)確率96%以上,意圖理解準(zhǔn)確率高達(dá)98%。

這里不去對(duì)比這些數(shù)字的優(yōu)劣,畢竟多數(shù)語(yǔ)音助手都能拿出還不錯(cuò)的成績(jī),但它們至少說(shuō)明“全雙工”交互下,準(zhǔn)確率仍能保持高水準(zhǔn)。不過(guò),在汽車(chē)有限的第三空間里塑造用戶(hù)體驗(yàn),語(yǔ)音助手們還有三大硬骨頭要啃——實(shí)現(xiàn)用戶(hù)的三種“區(qū)分”需求。

1、在幾何級(jí)技術(shù)難度升級(jí)的基礎(chǔ)上,區(qū)分“情境”

騰訊云小微稱(chēng)包括播放音樂(lè)、導(dǎo)航、查股票、查天氣等眾多服務(wù)在內(nèi),用戶(hù)都可以通過(guò)語(yǔ)音指令,跟車(chē)機(jī)一次喚醒、連續(xù)應(yīng)答、自然交互,這其中涉及一個(gè)很重要的問(wèn)題:跨情境的全雙工服務(wù)。

目前的車(chē)載語(yǔ)音助手已經(jīng)可以做到在一定場(chǎng)景內(nèi)免喚醒,例如常用的聽(tīng)音樂(lè),想聽(tīng)A歌曲又反悔,想聽(tīng)B歌曲,機(jī)器自動(dòng)識(shí)別不需要用戶(hù)多次喚醒。

而當(dāng)場(chǎng)景需求延展后,全雙工語(yǔ)音技術(shù)就不得不面臨既要連續(xù)、又要跨情境“思考”的挑戰(zhàn),而這又幾乎是汽車(chē)體驗(yàn)的必須,內(nèi)容、導(dǎo)航、查詢(xún)、設(shè)備控制……區(qū)分場(chǎng)景是“全雙工”的必要技能。

很明顯,即便是人的溝通在轉(zhuǎn)換話題時(shí)也需要適應(yīng),機(jī)器在面臨這種情境跨越的全雙工語(yǔ)音時(shí),其難度是乘法級(jí)的幾何提升,而非僅僅做疊加而已。

2、在復(fù)雜的對(duì)話環(huán)境中,區(qū)分“人”

與歐美不同,在當(dāng)下中國(guó)汽車(chē)文化中,家庭單位屬于仍然強(qiáng)于個(gè)人單位,“每家都有車(chē)”而不是“每人都有車(chē)”。很多時(shí)候,車(chē)中不只有司機(jī),而肯定有副駕駛等其他乘客。

所謂“第三空間”不只是為司機(jī)服務(wù),也為所有乘客服務(wù)。

對(duì)車(chē)載全雙工而言,這又帶來(lái)一個(gè)特殊的問(wèn)題,如何讓不同的人有屬于自己的完整體驗(yàn)。如果把全雙工比作一個(gè)人,與之溝通時(shí),司機(jī)或乘客肯定都希望他與自己的溝通是完整的。

從當(dāng)前的解決方式來(lái)看,行業(yè)主要采用多音區(qū)設(shè)置:主駕喚醒之后,都是聽(tīng)主駕的聲音,副駕的喚醒后,都是聽(tīng)副駕的語(yǔ)音,理論上,另一個(gè)人要接入全雙工交互,必須重新喚醒,才可以開(kāi)啟自己的完整對(duì)話體驗(yàn)。嚴(yán)格來(lái)說(shuō),這是通過(guò)物理設(shè)置的替代性方案,并非機(jī)器對(duì)不同聲音的完全識(shí)別,而是通過(guò)聲音的來(lái)源區(qū)分“人”。行業(yè)內(nèi)也正在發(fā)展的“聲紋識(shí)別技術(shù)”,直接辨別不同的用戶(hù),或才是未來(lái)更為徹底的解決方案,不過(guò)這仍需要等待。

3、在豐富多樣的服務(wù)中,區(qū)分“需求”

智能語(yǔ)音從一開(kāi)始就是兩條腿走路:前端聽(tīng)懂用戶(hù)說(shuō)了什么,后端根據(jù)用戶(hù)的個(gè)性化需求推薦給不同的內(nèi)容、服務(wù),或者執(zhí)行某些操控指令。

放到車(chē)載全雙工這里,其實(shí)問(wèn)題拓展到了兩個(gè)層面:

怎么聽(tīng)懂是對(duì)機(jī)器說(shuō)的,而不是對(duì)其他人說(shuō)的(比如人和人聊天),不要誤解用戶(hù)的需求;

在確定是對(duì)機(jī)器的需求后,如何實(shí)現(xiàn)更為個(gè)性化的服務(wù)輸出,畢竟,如果用戶(hù)想吃點(diǎn)喜歡吃的,你隨便導(dǎo)航到了一個(gè)用戶(hù)不喜歡的店子,或者甚至用戶(hù)想要去放松一下,你給導(dǎo)航到了公司,這樣的連續(xù)交互也就失去了意義。

前者需要語(yǔ)音識(shí)別能力的極大加強(qiáng),它還有許多細(xì)節(jié)需要用技術(shù)實(shí)現(xiàn),例如騰訊云小微稱(chēng)其借助云端大腦,不但能理解用戶(hù)的話哪些是需要響應(yīng)的指令,哪些只是用戶(hù)對(duì)別人說(shuō)的話,這其中同樣涉及復(fù)雜場(chǎng)景需求問(wèn)題,懂更多還要區(qū)分是不是需求,挑戰(zhàn)進(jìn)一步升級(jí)。

后者,本質(zhì)上可以視為個(gè)性化推薦機(jī)制的延續(xù),考驗(yàn)的語(yǔ)音助手背后的平臺(tái)數(shù)據(jù)能力,如何在盡可能短的時(shí)間內(nèi)了解眼前的用戶(hù),為其提供定制化服務(wù),強(qiáng)化全雙工的“實(shí)質(zhì)”支撐,而不是只有花架子。騰訊云小微打出“懂你所需”的旗號(hào),通過(guò)訓(xùn)練后推送定制化服務(wù)內(nèi)容,這是全雙工技術(shù)的行業(yè)必然,只是看誰(shuí)能更為準(zhǔn)確。

對(duì)用戶(hù)而言,同樣是自然的交互,如同與人交流一樣,與一個(gè)“懂你所需”的全雙工語(yǔ)音助手交互,就像是熟人聊天,而與無(wú)法實(shí)現(xiàn)定制化服務(wù)輸出的機(jī)器交互,就像是在和陌生人聊天,其體驗(yàn)差距無(wú)需多言。

全雙工語(yǔ)音助手趨勢(shì)不可避免,車(chē)載只是拼圖的一塊

幾乎不會(huì)有人否認(rèn),語(yǔ)音助手是人機(jī)交互必然趨勢(shì)。經(jīng)過(guò)幾年的發(fā)展,在巨頭們的努力下,越來(lái)越高的語(yǔ)音識(shí)別準(zhǔn)確率,各平臺(tái)飚出的準(zhǔn)確率指標(biāo),本身就證明機(jī)器的“聽(tīng)見(jiàn)”和“聽(tīng)懂”已經(jīng)逐步實(shí)現(xiàn),剩下的是不斷完善的過(guò)程。

而“智商”問(wèn)題一旦接近解決,“情商”問(wèn)題就走向臺(tái)前,讓機(jī)器更貼近人,實(shí)現(xiàn)人性化、情感化,是語(yǔ)音助手必然的趨勢(shì)。

于是,全雙工等新技術(shù)不斷涌現(xiàn)。幾乎可以肯定的是,在未來(lái),一方面全雙工必然要突破參數(shù)瓶頸,例如沒(méi)有30秒、90秒的區(qū)分,而是無(wú)限連續(xù)同時(shí)準(zhǔn)確識(shí)別需求,就是如科幻片機(jī)器人管家那樣的無(wú)縫交互,這是語(yǔ)音助手發(fā)展的必然;另一方面,更多其他的科技將不斷涌現(xiàn),例如多模態(tài)識(shí)別,將聲音、圖像、環(huán)境等諸多因素整合來(lái)與用戶(hù)自然交互。

而顯然,雖然車(chē)載急迫需要全雙工等更多自然交互技術(shù),但全雙工并不只會(huì)局限于車(chē)載。幾乎所有巨頭的全雙工技術(shù)的“理想”都是全場(chǎng)景應(yīng)用,即便是騰訊云小微選擇以車(chē)載為典型,未來(lái)也必將在全領(lǐng)域發(fā)力——到目前為止,在出行領(lǐng)域之外,騰訊云小微憑借全棧AI能力及騰訊豐富的內(nèi)容和服務(wù)生態(tài),在文旅、政務(wù)、教育、智能硬件等多個(gè)領(lǐng)域都有涉獵。

以硬件為例,騰訊云小微AI應(yīng)用解決方案已經(jīng)輸送到機(jī)器人、智能電視、智能音箱、智能空調(diào)等多個(gè)品牌多款產(chǎn)品中,而且百度、科大訊飛、阿里等玩家都在積極布局。

可以說(shuō),車(chē)載是全雙工最熱的局部戰(zhàn)場(chǎng),未來(lái)的全雙工將是全領(lǐng)域的戰(zhàn)爭(zhēng),屆時(shí),當(dāng)物聯(lián)網(wǎng)真正全面落地時(shí),汽車(chē)這樣的第三空間將融入一個(gè)相互連接、不分彼此的“唯一空間”,車(chē)載全雙工與家居、工作全雙工聯(lián)動(dòng),人與虛擬數(shù)字世界將實(shí)現(xiàn)無(wú)縫對(duì)接,一起拭目以待吧。

來(lái)源:科技向令說(shuō)

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車(chē) 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶(hù)希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱(chēng),數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱(chēng)"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉