智能語(yǔ)音:能識(shí)別但理解不了
掃描二維碼
隨時(shí)隨地手機(jī)看文章
蘋(píng)果Siri領(lǐng)銜 智能語(yǔ)音爆紅
2007年,國(guó)產(chǎn)手機(jī)金立曾推出一種「語(yǔ)音王」的手機(jī),喊一聲「張三」,它會(huì)自動(dòng)撥打張三的電話(huà),這,算智能語(yǔ)音嗎?
別誤會(huì),這只是一種傻瓜式語(yǔ)音,是單個(gè)字識(shí)別,一碰到連續(xù)的語(yǔ)句就「萎」了。
2011年10月,蘋(píng)果發(fā)布了iPhone 4S,自帶一種Siri的語(yǔ)音控制功能,能幫助用戶(hù)讀簡(jiǎn)訊、查天氣,還能學(xué)習(xí)新的聲音語(yǔ)調(diào),提供對(duì)話(huà)式問(wèn)答,蘋(píng)果開(kāi)啟了智能語(yǔ)音交互時(shí)代。
不信?來(lái)看一組用戶(hù)與Siri的測(cè)試對(duì)話(huà)?!改闶钦l(shuí)?」「我是Siri。」「你是女孩嗎?」「不是」「你是男孩嗎?」「我不覺(jué)得咱們有時(shí)間扯這些」「我喜歡你」「咱倆是不可能的」。
Siri誕生之后爆紅全球,隨后谷歌、百度也推出了類(lèi)似語(yǔ)音產(chǎn)品。今年hTC、摩托羅拉推出的旗艦機(jī)中也帶有此類(lèi)功能,如小i機(jī)器人。
穿戴設(shè)備頻出 催生三個(gè)技術(shù)環(huán)節(jié)
易觀分析師王俊認(rèn)為,智能語(yǔ)音已經(jīng)誕生新的需求,「一些穿戴設(shè)備沒(méi)有鍵盤(pán)、沒(méi)有觸屏,有些連屏幕都沒(méi)有?!?/p>
繼索尼、三星發(fā)布智能手表后,10月17日,阿迪達(dá)斯也發(fā)布了miCoach SMART RUN,加上此前智器、盛大等國(guó)產(chǎn)廠商推出的產(chǎn)品,智能手表產(chǎn)品一時(shí)暴增。又在10月,樂(lè)視、小米、阿里酷開(kāi)電視全面預(yù)售,三款電視中,樂(lè)視、酷開(kāi)均支持語(yǔ)音識(shí)別功能。
智能產(chǎn)品的發(fā)布,對(duì)語(yǔ)音識(shí)別提出了新的要求。10月19日,記者見(jiàn)到了樂(lè)視TV、智器手表語(yǔ)音技術(shù)提供者云知聲團(tuán)隊(duì),其CTO康恒博士表示,智能語(yǔ)音主要包含三個(gè)部分:語(yǔ)音識(shí)別、語(yǔ)義解析、知識(shí)圖譜。
為了演示效果,他用手機(jī)語(yǔ)音操控電視:「明天上海天氣」,電視立刻回應(yīng)「正在為您查詢(xún)」,隨后天氣信息便顯示出來(lái)。電視先是聽(tīng)懂康恒說(shuō)話(huà)(語(yǔ)音識(shí)別),然后認(rèn)為他是要查詢(xún)上海天氣,最后提供了天氣信息(知識(shí)圖譜)。
準(zhǔn)確率逐級(jí)降低 達(dá)80%就算優(yōu)質(zhì)
「市面上產(chǎn)品語(yǔ)音識(shí)別準(zhǔn)確率會(huì)較高,但是到語(yǔ)音解析會(huì)低一點(diǎn),到知識(shí)圖譜會(huì)更低一點(diǎn),最終準(zhǔn)確率能達(dá)到80%就算是優(yōu)質(zhì)產(chǎn)品?!雇蹩”硎?,這三個(gè)環(huán)節(jié)中,語(yǔ)義解析技術(shù)難度最高。
目前的發(fā)展?fàn)顩r是,語(yǔ)音識(shí)別準(zhǔn)確率很高,據(jù)康恒介紹,云知聲語(yǔ)音識(shí)別準(zhǔn)確率為95%。
「要消滅剩下的5%非常困難,需要從每個(gè)細(xì)節(jié)入手,先把環(huán)境雜訊解決,1%可能解決了;再把口音問(wèn)題解決一點(diǎn),1%就上去了;再把聲音采樣庫(kù)擴(kuò)大點(diǎn),1%又消滅了?!箍岛惚硎?,要達(dá)到99%的準(zhǔn)確率,云知聲可能需要五年。
康恒還說(shuō)道,語(yǔ)義解析與知識(shí)圖譜是一個(gè)很前沿的課題。「比如『你有多少根頭發(fā)』,我能聽(tīng)明白也能理解,但是不知道答案。計(jì)算機(jī)也需要一個(gè)漫長(zhǎng)的學(xué)習(xí)過(guò)程?!钩繄?bào)記者 王方