真正智能的語(yǔ)音識(shí)別系統(tǒng)離我們還有多遠(yuǎn)
掃描二維碼
隨時(shí)隨地手機(jī)看文章
(文章來(lái)源:百家號(hào))
如果單獨(dú)是因?yàn)榭谝魡?wèn)題,現(xiàn)在這么多在研究語(yǔ)音識(shí)別系統(tǒng)的公司,如果合作起來(lái),只要資源共享,這應(yīng)該不是個(gè)問(wèn)題。那么,制約語(yǔ)音識(shí)別發(fā)展的最主要原因來(lái)了,各家公司語(yǔ)音識(shí)別系統(tǒng)的源數(shù)據(jù)并不共享。語(yǔ)音識(shí)別中最重要的就是對(duì)語(yǔ)音的采集和分析,這是項(xiàng)工作量非常龐大的內(nèi)容,如果想要構(gòu)建支持不同口音的語(yǔ)音識(shí)別系統(tǒng),這一工作量還將呈幾何倍數(shù)驟增。
所以,即使是對(duì)于蘋果或亞馬遜這樣的超大型公司來(lái)說(shuō),也不可能支持無(wú)限語(yǔ)種的采集和分析。因此,各家研究語(yǔ)音識(shí)別系統(tǒng)的公司對(duì)源數(shù)據(jù)的保密控制堪稱苛刻,想弄到其他公司的語(yǔ)音源數(shù)據(jù)也是根本不可能的。
除去口音問(wèn)題和源數(shù)據(jù)不共享的問(wèn)題,語(yǔ)音識(shí)別系統(tǒng)的分析能力和云計(jì)算能力也是嚴(yán)重制約語(yǔ)音發(fā)展的重要因素。當(dāng)用戶在使用語(yǔ)音系統(tǒng)時(shí),設(shè)備端收集到語(yǔ)音,需要通過(guò)識(shí)別系統(tǒng)的云計(jì)算能力進(jìn)行運(yùn)算和分析。云計(jì)算能力和支持云計(jì)算的硬件、傳輸網(wǎng)絡(luò)都不是一個(gè)非常好解決的問(wèn)題,需要較長(zhǎng)時(shí)間的積累不斷完善優(yōu)化。
很多人都覺(jué)得現(xiàn)在使用的語(yǔ)音識(shí)別系統(tǒng)并不好用,完全達(dá)不到我們想象中那種能夠僅憑借語(yǔ)音就能實(shí)現(xiàn)所有操作,或者能夠幫我們節(jié)約大量時(shí)間的程度。更多時(shí)候,我們會(huì)感覺(jué)面對(duì)的不適一個(gè)智能的語(yǔ)音識(shí)別系統(tǒng),而是家中聽(tīng)不懂我們?cè)谡f(shuō)什么的寵物或者小孩子,需要我們放慢語(yǔ)氣、用最標(biāo)準(zhǔn)的普通話、一遍一遍的和他們慢慢說(shuō)。不過(guò)別著急,現(xiàn)在的語(yǔ)音識(shí)別系統(tǒng)還真就是個(gè)孩子,它正在以非??斓乃俣冗M(jìn)步著,相信不久以后,真正好用的語(yǔ)音識(shí)別系統(tǒng)就會(huì)出現(xiàn)在我們身邊。