語音識(shí)別雖然已經(jīng)發(fā)展的如火如荼,但還是有不少問題要改進(jìn),就如下面一段和語音識(shí)別相關(guān)的搞笑視頻里。也許,口音差異也是語音識(shí)別的一個(gè)難題。
語音識(shí)別技術(shù),也被稱為自動(dòng)語音識(shí)別(ASR),其目標(biāo)是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列。與說話人識(shí)別及說話人確認(rèn)不同,后者嘗試識(shí)別或確認(rèn)發(fā)出語音的說話人而非其中所包含的詞匯內(nèi)容。
語音識(shí)別技術(shù)的應(yīng)用包括語音撥號(hào)、語音導(dǎo)航、室內(nèi)設(shè)備控制、語音文檔檢索、簡(jiǎn)單的聽寫數(shù)據(jù)錄入等。語音識(shí)別技術(shù)與其他自然語言處理技術(shù)如機(jī)器翻譯及語音合成技術(shù)相結(jié)合,可以構(gòu)建出更加復(fù)雜的應(yīng)用,例如語音到語音的翻譯。
語音識(shí)別技術(shù)所涉及的領(lǐng)域包括:信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和聽覺機(jī)理、人工智能等等。
語音識(shí)別以谷歌GoogleNow和蘋果Siri為代表,將智能手機(jī)的功能帶入到人機(jī)互動(dòng)時(shí)代。除了手機(jī)以外,如三星、LG、聯(lián)想的語音識(shí)別電視,各種安卓、iOS系統(tǒng)的平板幾乎都有語音識(shí)別功能。通過語音識(shí)別功能,用戶從一定程度上解放了雙手,也讓人們看到了未來人工智能領(lǐng)域廣闊的應(yīng)用前景。 |