智能語音技術(shù)漸漸成熟 將改變?nèi)藱C(jī)交互方式
越來越多的業(yè)內(nèi)人士認(rèn)為,語音技術(shù)在兩三年內(nèi),會(huì)徹底改變當(dāng)前的人機(jī)交互方式。北美最大的語音技術(shù)提供商N(yùn)uance的高管最近就說:“語音和自然語義理解突然成為一門前沿科技,而我們正站在這個(gè)過渡點(diǎn)上。我認(rèn)為語音識(shí)別將真正顛覆目前的計(jì)算機(jī)交互接口。”
整個(gè)語音行業(yè)從2010年蘋果公司推出Siri開始,受到越來越多的關(guān)注。這個(gè)趨勢(shì)從國內(nèi)最大的語音技術(shù)廠商科大訊飛的股價(jià)也能看出。科大訊飛2008年上市之初市值只有約34億元,市盈率不到30倍。但最近一年股價(jià)節(jié)節(jié)高攀,目前市值達(dá)到140億元,市盈率約70倍。
為何語音行業(yè)受到如此重視?國內(nèi)這個(gè)行業(yè)的供應(yīng)商都有哪些?這個(gè)行業(yè)中的核心技術(shù)包括哪些?語音行業(yè)前景和想象的市場空間有多大?
智能語音技術(shù)改變傳統(tǒng)交互方式
智能語音交互首先改變的是移動(dòng)互聯(lián)網(wǎng)。以iPhone中內(nèi)置的Siri為例,用戶以自然語言的方式對(duì)智能手機(jī)下達(dá)指令,而手機(jī)根據(jù)用戶語音和用戶當(dāng)前的環(huán)境及上下文對(duì)用戶意圖進(jìn)行理解,并按照用戶意圖執(zhí)行命令的過程。如用戶說“查找附近的川菜館”,則手機(jī)會(huì)搜索用戶當(dāng)前所在位置附近的川菜風(fēng)味餐廳,并將列表顯示出來供用戶選擇查看。
百度多媒體負(fù)責(zé)人余凱曾表示“如今的語音搜索不同于傳統(tǒng)搜索模式,不是基于無關(guān)聯(lián)的幾個(gè)關(guān)鍵詞來反饋結(jié)果,而是能夠理解用戶指令,完成一項(xiàng)完整的任務(wù)。”也就是說,語音搜索已經(jīng)不僅局限于將客戶需要的信息呈現(xiàn)出來,還會(huì)將一些連鎖信息進(jìn)行反饋,自動(dòng)生成給客戶一套全面的服務(wù),基于這種高智能化的技術(shù)進(jìn)化,語音必將成為日后移動(dòng)互聯(lián)網(wǎng)的入口之一。
電視和機(jī)頂盒也是采用智能語音交互比較積極的行業(yè)。傳統(tǒng)的電視機(jī)和機(jī)頂盒的遙控操作都比較復(fù)雜,而采用智能語音交互技術(shù),只需對(duì)著遙控器說話,就可以控制電視,輸入文字、打開應(yīng)用、播放視頻都可輕松實(shí)現(xiàn)。去年三星、LG和聯(lián)想等都發(fā)布了帶有專用語音輸入功能的遙控器,甚至有的還實(shí)現(xiàn)了類似Siri的語音助手的功能。
傳統(tǒng)行業(yè)利用智能語音交互技術(shù)進(jìn)行業(yè)務(wù)效率提升的意愿也比較強(qiáng)烈。比如傳統(tǒng)呼叫中心領(lǐng)域,需要投入大量資金、人力,甚至建設(shè)大面積的人工語音座席,每年投入上百億資金。國外早已普遍采用基于智能語音交互技術(shù)改造的呼叫中心,大量的用戶常見問題、投訴和建議都可以被自動(dòng)識(shí)別和回復(fù),節(jié)省了成本。而且這些呼叫中心每天收到大量的用戶語音數(shù)據(jù),包含了龐大數(shù)量的用戶信息、偏好,都具有極大價(jià)值。但是如果不能利用智能語音技術(shù)進(jìn)行數(shù)據(jù)處理和挖掘,這些信息就如同儲(chǔ)量龐大的金礦,卻無法開采。為了開發(fā)這些數(shù)據(jù),傳統(tǒng)呼叫中心都對(duì)投入智能語音交互技術(shù)抱有極大熱情。
另外,汽車、玩具、穿戴設(shè)備都對(duì)智能交互技術(shù)能提供的全新交互方式抱有很大的期待。語音技術(shù)作為一個(gè)已經(jīng)漸漸成熟的基礎(chǔ)技術(shù),隨著使用面日漸擴(kuò)大,必將越來越改變傳統(tǒng)的人機(jī)交互方式。