當(dāng)下語(yǔ)音識(shí)別技術(shù)的市場(chǎng)發(fā)展突飛猛進(jìn)
掃描二維碼
隨時(shí)隨地手機(jī)看文章
(文章來(lái)源:AI語(yǔ)音新技術(shù))
近年來(lái),語(yǔ)音識(shí)別技術(shù)取得了重大進(jìn)展,并已開始從實(shí)驗(yàn)室走向人們的生活。 預(yù)計(jì)在未來(lái)10年內(nèi),語(yǔ)音識(shí)別技術(shù)將進(jìn)入各個(gè)領(lǐng)域,如工業(yè)、家用電子產(chǎn)品、通信、汽車電子。今天小編就語(yǔ)音識(shí)別的公司來(lái)分析。
大致來(lái)看,語(yǔ)音識(shí)別可以分為以下三個(gè)梯隊(duì):第一梯隊(duì):科大訊飛、騰訊、百度第二梯隊(duì):思必馳、捷通華聲、聲智科技、云之聲等,第三梯隊(duì):客知音等創(chuàng)業(yè)公司或者背靠其他學(xué)術(shù)或技術(shù)團(tuán)隊(duì)。
科大訊飛是語(yǔ)音識(shí)別領(lǐng)域的老大,無(wú)論是市場(chǎng)占有還是技術(shù)創(chuàng)新;騰訊和百度團(tuán)隊(duì)實(shí)力毋容置疑,潛力很大。不管怎么說(shuō),第一梯隊(duì)的語(yǔ)音識(shí)別率和團(tuán)隊(duì)的技術(shù)實(shí)力都是最強(qiáng)的。訊飛輸入法首發(fā)方言識(shí)別引擎,支持方言已達(dá)15種,用戶超過(guò)2.5億。百度在語(yǔ)音識(shí)別、語(yǔ)音測(cè)試等方面有十幾年的數(shù)據(jù)積累,實(shí)力雄厚。
思必馳在技術(shù)上也很不錯(cuò),整體通用識(shí)別率屬第二梯隊(duì),對(duì)于生僻字識(shí)別也有其優(yōu)勢(shì),主要服務(wù)于智能硬件的三個(gè)垂直領(lǐng)域:智能機(jī)器人、智能車載和智能家居,提供自然語(yǔ)言交互解決方案。捷通華聲在語(yǔ)音合成和語(yǔ)義理解上有獨(dú)特建樹。聲智科技提供從端到云的智能語(yǔ)音交互技術(shù)和服務(wù)方案,以及從芯片、模組、開發(fā)板到白牌產(chǎn)品的智能語(yǔ)音應(yīng)用方案。
第三梯隊(duì)是客知音等創(chuàng)業(yè)公司依靠國(guó)外的語(yǔ)音技術(shù),在單個(gè)領(lǐng)域的語(yǔ)音識(shí)別比業(yè)界通用的語(yǔ)音識(shí)別引擎要高,垂直聚焦于聚焦于壽險(xiǎn)行業(yè)和政府熱線的服務(wù)。其他技術(shù)團(tuán)隊(duì)有中科院聲學(xué)所和自動(dòng)化所。
在未來(lái)的語(yǔ)音識(shí)別市場(chǎng)中,越來(lái)越多的公司有望參與其中。 在未來(lái),語(yǔ)音識(shí)別的表現(xiàn)可能更多地體現(xiàn)在前端技術(shù)和語(yǔ)義理解上。如果機(jī)器想要自然地與人溝通,當(dāng)然,它不能重復(fù)這套手機(jī)的語(yǔ)音對(duì)話規(guī)則。它必須考慮許多因素,例如用戶說(shuō)話的環(huán)境,周圍環(huán)境中的噪音,用戶不準(zhǔn)確的發(fā)音或方言。這需要前端技術(shù)更準(zhǔn)確地模擬人體結(jié)構(gòu)并模擬機(jī)器人的聽覺系統(tǒng),以達(dá)到解放雙手之間自由對(duì)話的目的。