近日,微軟的一份聲明表示,語音識別技術的精準性已經(jīng)能媲美人類。微軟 CEO 薩提亞·納德拉認為,這一新突破對計算機行業(yè)的意義不亞于圖形用戶界面,不久后,這種能力將會普及到整個計算機行業(yè)中。
國內(nèi)錘子M1發(fā)布會現(xiàn)場,科大訊飛的語音識別技術快速、精準地將羅永浩講出的話翻譯成文字,引起滿堂喝彩。
媒體報道,百度與美國斯坦福大學合作推出的語音輸入App ,其比手動輸入快3倍,準確性也更高。
近期發(fā)生的上述三大事件,成功引起了市場對語音識別技術的關注。
網(wǎng)絡安全時代,為何語音識別技術不溫不火?
隨著互聯(lián)網(wǎng)技術不斷普及,我們迎來了網(wǎng)絡安全時代,生物識別技術也有了用武之地。
目前,生物識別技術中,指紋識別應用最為成熟,且生命力旺盛。
手機廠商熱衷于讓指紋識別技術充當解鎖或支付的功能,盡管這一技術還存在手指脫皮就無法識別的問題,但手機廠商并未放棄它。小米最新旗艦手機小米 5S 甚至還推出了超聲波指紋識別技術,解決了這一問題。
除此之外,媒體報道,蘋果全新的兩款 Macbook ,也將在電源鍵中集成 Touch ID ,以供用戶指紋解鎖。
人臉識別方面,隨著支付寶的大力推廣,其在互聯(lián)網(wǎng)金融領域的應用前景十分美好。
虹膜識別技術,是生物識別領域的“黑科技”,識別精準度更高,在對安全有極高要求的場景下,這一技術同樣有發(fā)展的空間。
與之相比,語音識別技術則發(fā)展的不溫不火。究其原因,應用場景尷尬是其中之一。畢竟,比手指接觸設備、紅外線掃描人臉或虹膜的方式相比,語音識別需要通過發(fā)聲的方式進行,這樣在有人或者無人的場景下,這種進行身份認定的方式都讓人覺得怪怪的。
找準應用場景,語音識別潛力無限早前,重視互聯(lián)網(wǎng)安全的環(huán)境下,語音識別沒有發(fā)展的機會。隨著物聯(lián)網(wǎng)技術與人工智能技術不斷落地,語音識別迎來了生機。
盡管在解鎖、支付方面,語音識別依舊難以普及,不過,語音識別將語言轉(zhuǎn)換成文字或者命令的獨特屬性,有望助力其在更多場景中發(fā)揮作用。
比如,科大訊飛與百度的語音輸入,將語言轉(zhuǎn)換成文字,這是其他幾大生物識別技術都無法處理的事情。以此作為出發(fā)點,未來語音識別將能用在寫作與出版領域。
至于語音轉(zhuǎn)換成命令方面,語音識別技術可以做的事情就更多了,比如在消費娛樂領域,VR游戲正是風尚,引入語音識別技術后,玩家可拋棄游戲手柄,真正做到沉浸式的體驗當中。
又比如在微軟小娜、蘋果 Siri ,智能家居、車聯(lián)網(wǎng)等領域中,成熟的語音識別技術將可讓機器人迅速理解你的指令,并采取相應的措施,生活智能化程度得到極大提高。
要指出的是,在語音轉(zhuǎn)換文字、語音指令方面,語音識別還存在準確率待提高、延時等瓶頸,不過隨著語音識別技術不斷提升,這些問題在未來可以不斷得到改善,語音識別市場潛力還將繼續(xù)上升。
研究機構(gòu)指出, 2015 年全球語音識別市場規(guī)模約為 61.9 億美元,預計到2020年可以接近 200 億美元。