車聯(lián)網(wǎng)中人機(jī)交互,語音已成標(biāo)配
如今,人機(jī)交互技術(shù)應(yīng)用潛力開始凸顯,比如智能手機(jī)配備空間跟蹤技術(shù),應(yīng)用于虛擬現(xiàn)實(shí)、遙控機(jī)器人及遠(yuǎn)程醫(yī)療等的觸覺交互技術(shù),對(duì)于有語言障礙的人士的無聲語音識(shí)別,還有各種創(chuàng)新技術(shù),如指紋識(shí)別、TDDI 、壓力觸控技術(shù)等,現(xiàn)在都比較熱門。
在車聯(lián)網(wǎng)領(lǐng)域的人機(jī)交互,特別是語音交互技術(shù)應(yīng)用越來越明顯,智能后視鏡、HUD、車機(jī)、車載音箱以及中控系統(tǒng),都紛紛加入了語音交互系統(tǒng)。在車聯(lián)網(wǎng)以及車上的人機(jī)交互,其實(shí)是一個(gè)非常重要的業(yè)務(wù)方向,在這個(gè)方向上,思必馳一直專注在車聯(lián)網(wǎng)的一些人機(jī)交互以及第三方內(nèi)容的服務(wù)平臺(tái)整合。那么在車載環(huán)境下語音技術(shù)的應(yīng)用,到底應(yīng)該關(guān)注些什么?對(duì)此,電子發(fā)燒友針對(duì)車聯(lián)網(wǎng)中的人機(jī)交互與后端服務(wù)采訪了思必馳副總裁雷雄國。
圖1:思必馳副總裁雷雄國
針對(duì)語音標(biāo)配問題,思必馳副總裁雷雄國談到,手機(jī)的標(biāo)配是觸控,智能手機(jī)的標(biāo)配是觸控,從交互模式上來看,語音交互是從觸控到語言的交互,這個(gè)是一個(gè)方面;另一方面,未來很多的交互會(huì)依托與它的硬件形態(tài),也就是現(xiàn)在很多人說手機(jī)未來會(huì)多少年會(huì)消失,但是從真正科技發(fā)展的角度來看,包括現(xiàn)在物聯(lián)網(wǎng)整個(gè)的興起,很多新奇的硬件都會(huì)智能化,這時(shí)候各種各樣的手背其實(shí)并沒有屏幕的,而交互的核心目的是希望在這些硬件上面獲取一些信息、功能,通過硬件顯然是不能滿足,在這樣一個(gè)發(fā)展情勢(shì)下,語音一定會(huì)成為標(biāo)配。
從交互的角度來看,在接下來的車載智能化的過程中,語音僅僅是占人機(jī)交互其中的一個(gè)環(huán)節(jié)。雷雄國指出,希望能看到更多的交互跟語音結(jié)合在一起,包括體感、手勢(shì)、圖象等等一系列的人工智能的技術(shù)能夠迅速進(jìn)入到車內(nèi),并有多個(gè)在實(shí)際車載里面應(yīng)用的多模態(tài)技術(shù)。
語音交互中難點(diǎn)該如何攻克
在談?wù)撥囕d語音怎么去用,交互怎么去做的時(shí)候,作為一家語音技術(shù)的廠商思必馳,更多關(guān)注的是語音到底能解決什么問題,以及在目前的應(yīng)用過程中,語音技術(shù)還有那些難點(diǎn)需要去攻克?對(duì)此,雷雄國分享了三點(diǎn)。
第一,噪聲環(huán)境。噪音環(huán)境非常重要,需要得到非常好的解決,能夠在車載的環(huán)境下,把噪聲問題解決掉是人機(jī)交互第一步的基礎(chǔ)。在解決這個(gè)問題的時(shí)候,有一大類的方向是包括在出現(xiàn)錯(cuò)誤的時(shí)候,允許糾正打斷;包括對(duì)一些車載噪聲以及環(huán)境噪聲的抑制自適應(yīng);包括在實(shí)際車的設(shè)備在播放一些音樂或者聲音的時(shí)候,能夠隨時(shí)的打斷它等等這些;
第二,智能交互。在交互的過程中,其實(shí)很多的交互只是提到了語音識(shí)別,這方面事實(shí)上用戶體驗(yàn)非常不好,它其實(shí)更多的包括人工智能的核心技術(shù)引進(jìn),包括跟車內(nèi)業(yè)務(wù)的整合,使得車內(nèi)的人機(jī)語音交互能達(dá)到更高的用戶體驗(yàn),這里面就包括一些對(duì)于語音理解,以及人機(jī)多人的交互對(duì)話,基于任務(wù)式的深度的交互理解;
第三,更貼合用戶需求的產(chǎn)品設(shè)計(jì)。經(jīng)過多年跟一線客戶的交流得出非常重要的一點(diǎn),其實(shí)很多時(shí)候技術(shù)上可能達(dá)到了一定的階段,事實(shí)上需要上下游合作伙伴一塊來針對(duì)車聯(lián)網(wǎng)的產(chǎn)品進(jìn)行多方位、多層次的結(jié)合跟設(shè)計(jì),這里面需要產(chǎn)品方、技術(shù)方,甚至需要廠商一塊來配合。
交互核心在車?yán)锩娼换ケ容^重要的一塊,就是回音消除。雷雄國表示,產(chǎn)品設(shè)計(jì)是全方位的,可以從三個(gè)角度來看。
其一,對(duì)于在車內(nèi)環(huán)境下面,其實(shí)很多車主在開車的過程中都會(huì)開啟背景音樂,在背景音樂開啟的情況下在做其它的操作,這時(shí)候其實(shí)是需要有這種背景音樂的情況下去打斷他,這時(shí)候事實(shí)上麥克風(fēng)跟喇叭的一些結(jié)構(gòu)的設(shè)計(jì),產(chǎn)品在這一塊需要做些配合,這是其中一個(gè);
其二,對(duì)于語音技術(shù)怎么樣跟業(yè)務(wù)結(jié)合,怎么樣跟導(dǎo)航結(jié)合,怎么樣把第三方的音樂資源對(duì)接得更加地緊密、無縫,這里面也需要投入大量的產(chǎn)品設(shè)計(jì)以及開發(fā)去做,把它的用戶體驗(yàn)做到極致;
其三,就是在目前的車的環(huán)境我們能夠提供的相對(duì)更加聚焦,所以把導(dǎo)航、電臺(tái)、第三方路礦等等跟車主相關(guān)的第三方服務(wù)整合在一塊,這是非常重要的點(diǎn)。
圍繞著這些,思必馳在對(duì)語音識(shí)別的交互技術(shù)上做了一些上下游合作伙伴的整合,這個(gè)是在技術(shù)導(dǎo)航這一塊,跟百度、高德、海立德一系列的市面上主流的廠商都做了深度的整合。在實(shí)際很多的車載使用場(chǎng)景,其實(shí)都能交互,能夠讓用戶真正的實(shí)現(xiàn)全程語音交互,也就是他不需要在開車的過程中中間再去結(jié)合手觸屏的交互結(jié)束任務(wù),這是非常重要的方面。
為車聯(lián)網(wǎng)打造了AIOS系統(tǒng)
談到操作系統(tǒng)上,雷雄國表示,思必馳在車聯(lián)網(wǎng)領(lǐng)域打造了一個(gè)AIOS,它是一個(gè)后操作系統(tǒng),實(shí)際上也不是一個(gè)操作系統(tǒng),只是把語音交互,包括內(nèi)容服務(wù)等等這些整合在一塊,能夠迅速地讓第三方能夠把車聯(lián)網(wǎng)的整個(gè)語音交互給做起來的這么一個(gè)后操作系統(tǒng)。AIOS主要有四大特色。
1、內(nèi)置智能語音交互:最先進(jìn)的智能對(duì)話交互技術(shù),彌補(bǔ)傳統(tǒng)操作系統(tǒng)在自然語音和語音交互上的缺失;
2、支持主流操作系統(tǒng):可定制型智能交互中間系統(tǒng),運(yùn)行于主流操作系統(tǒng)上的侯操作系統(tǒng),支持Android、QNX、Linux等;
3、快速集成支持定制:支持快速集成和自定義開發(fā),只需要簡單的業(yè)務(wù)層接口集成即可封裝出貨;
4、集成豐富內(nèi)容服務(wù):除了強(qiáng)大的語音交互功能外,還能提供廣泛的第三方內(nèi)容集成服務(wù)。
雷雄國補(bǔ)充道,思必馳目前除了AIOS之外,還有針對(duì)機(jī)器人以及智能家居的整套解決方案,AIOS里面有一系列的核心技術(shù),AI這一塊,對(duì)于合作伙伴和用戶來說它并不是特別關(guān)注,對(duì)于語音技術(shù)絲毫不了解的開發(fā)者來說,并不影響他去使用整個(gè)語音交互的功能,OS這一塊,把這些功能做一系列模塊化的組建,在每一個(gè)客戶有一些定制需求的時(shí)候,能夠做到自己去做定制開發(fā),所以這給用戶和開發(fā)者留下非常差異化的實(shí)現(xiàn)方式。
另外,第三方服務(wù)包括地圖類的、影印類以及第三方的基于O2O的服務(wù),目前思必馳都已經(jīng)把這些服務(wù)接進(jìn)來。雷雄國表示,目前希望在這些平臺(tái)上接入更多合作伙伴關(guān)于車的服務(wù),除了智能車載,還有智能家居和機(jī)器人,在這兩個(gè)領(lǐng)域還有一些核心技術(shù),其實(shí)包括原廠的識(shí)別,包括回音消除以及聲源定位等等相關(guān)技術(shù),這些技術(shù)在整個(gè)的交互過程中會(huì)扮演著非常重要的角色。
從目前第三方合作內(nèi)容的上面來看,思必馳也是一個(gè)非常開放的心態(tài)。雷雄國強(qiáng)調(diào),思必馳希望能夠與跟更多的第三方內(nèi)容服務(wù)方合作,把語音交互做得可以提供每一個(gè)內(nèi)容服務(wù),也可以從語音交互都能夠關(guān)注到內(nèi)容服務(wù),達(dá)到?jīng)]有雙手交互的情況下也能傳遞給車主用戶。