Siri開發(fā)商鉆研中文聲控軟件:四聲傻傻分不清
Nuance給這款中文語(yǔ)音識(shí)別軟件起了個(gè)很中國(guó)的名字“龍”
據(jù)國(guó)外媒體報(bào)道,按照蘋果的計(jì)劃,今年年內(nèi)將推出中文版Siri。此外,Siri開發(fā)商N(yùn)uance Communications還在開發(fā)中文語(yǔ)音識(shí)別應(yīng)用Dragon(龍)。
對(duì)于聲控識(shí)別軟件來(lái)講,中文識(shí)別最大的難度在于漢語(yǔ)四聲。以“媽”為例,很難讓聲控軟件在一個(gè)句子內(nèi)準(zhǔn)確識(shí)別出“媽”“麻”“馬”“罵”四個(gè)音調(diào)。
另外一個(gè)難度在于中國(guó)的方言。中國(guó)方言眾多,一般而言,北方方言區(qū)的人也不能與吳語(yǔ)區(qū)、粵語(yǔ)區(qū)的人溝通。因此聲控軟件的目標(biāo)只是標(biāo)準(zhǔn)普通話,帶有輕微口音的普通話也在Dragon希望可以識(shí)別的范圍內(nèi)。
測(cè)試Dragon時(shí),“最近的星巴克店在哪里”“我要去市場(chǎng)”等它都可以識(shí)別。不過(guò)大多數(shù)來(lái)測(cè)試或使用的人都會(huì)有“調(diào)戲”心理,一心想要看看Dragon的極限在哪里。
用繞口令“媽媽騎馬,馬慢,媽媽罵馬”考驗(yàn)Dragon時(shí),它的識(shí)別是“媽媽起碼,媽媽,媽媽嗎嗎”。
Nuance首席營(yíng)銷官Peter Mahoney表示,公司正在分析研究這些數(shù)據(jù),希望能優(yōu)化到預(yù)期水平。