錘子M1助科大訊飛上頭條 語音識(shí)別藍(lán)海將到?
繼狀告百度輸入法侵權(quán)上了頭條后,科大訊飛借錘子科技新品發(fā)布會(huì),又上了一次頭條。
2016 年 10 月 18 日晚上,錘子科技發(fā)布了最新旗艦智能手機(jī) M1 與 M1 Plus 。會(huì)上,錘子科技創(chuàng)始人羅永浩向公眾展示了新旗艦手機(jī)的多項(xiàng)功能,其中科大訊飛超精準(zhǔn)的語音輸入贏得了諸多觀眾的掌聲。
據(jù)羅永浩透露,科大訊飛的語音識(shí)別率已經(jīng)高達(dá) 97 %,如果不是發(fā)給那些非常咬文嚼字的人看的話,經(jīng)過訊飛語音識(shí)別的文字基本可以直接發(fā)送。
▲ 訊飛語音輸入獲錘子力挺(Source:錘子科技微博)
語音輸入比鍵盤輸入更加方便(無需用手)、快速(人每分鐘能講出 150 個(gè)單詞,卻只能打出 40 個(gè)字)的優(yōu)勢(shì),這是其興起的基礎(chǔ)。
科大訊飛的語音輸入,為我們揭示了語音識(shí)別應(yīng)用的冰山一角。事實(shí)上,除了讓機(jī)器將語音轉(zhuǎn)換成文字,語音識(shí)別還能將語音信號(hào)轉(zhuǎn)換成命令,從而成為互聯(lián)網(wǎng)場(chǎng)景下的控制中心。
語音識(shí)別藍(lán)海即將到來,三大應(yīng)用引期待
近年,伴隨物聯(lián)網(wǎng)技術(shù)與人工智能技術(shù)不斷落地,語音識(shí)別技術(shù)重要性不斷凸顯。“互聯(lián)網(wǎng)女皇”瑪麗·米克爾發(fā)布的 2016 年互聯(lián)網(wǎng)趨勢(shì)報(bào)告中,將語音識(shí)別技術(shù)列為重要的技術(shù)趨勢(shì),瑪麗·米克爾認(rèn)為,未來的計(jì)算界面將可由鍵盤升級(jí)至麥克風(fēng)加鍵盤的模式。
另外,亞馬遜的 Echo 音響內(nèi)置了 Amazon Alexa 語音助手、蘋果在手機(jī)以及電腦上搭載了 Siri ,微軟推出了小娜與小冰;谷歌正式推出了面向 Android 與 ios 系統(tǒng)的 Allo ……科技大佬們正積極推動(dòng)語音識(shí)別技術(shù)的發(fā)展。
受以上因素刺激,業(yè)界認(rèn)為,語音識(shí)別技術(shù)的藍(lán)海即將到來,從業(yè)界的動(dòng)態(tài)來看,其在搜索引擎、智能家居以及智能汽車三方面的應(yīng)用備受期待。
語音識(shí)別將可取代傳統(tǒng)的搜索引擎,成為互聯(lián)網(wǎng)的重要入口。 Amazon Alexa 、 Siri 、微軟小娜、谷歌 Allo 都在為此目標(biāo)努力,取代傳統(tǒng)搜索引擎后,語音識(shí)別技術(shù)將可收獲網(wǎng)絡(luò)營銷、用戶調(diào)研、收費(fèi)問答等多個(gè)領(lǐng)域的市場(chǎng)。
智能家居領(lǐng)域,需要將多款遙控設(shè)備集成于一個(gè)設(shè)備中,供用戶操作,大多時(shí)候,智能手機(jī) APP 充當(dāng)了這一功能。語音識(shí)別技術(shù)加入后,通過聲音指令,即可實(shí)現(xiàn)對(duì)家居環(huán)境中各個(gè)聯(lián)網(wǎng)設(shè)備的控制,這種方式更加便捷。
智能汽車領(lǐng)域中,自動(dòng)駕駛技術(shù)無疑是重點(diǎn),除此之外,語音識(shí)別技術(shù)也能有效提高汽車的智能性。比如可進(jìn)行全語音交互的地圖導(dǎo)航、又比如駕駛之外的車內(nèi)交互場(chǎng)景(打電話、查詢天氣、播放音樂等)。
延時(shí)與準(zhǔn)確兩大痛點(diǎn),語音識(shí)別技術(shù)待提升
語音識(shí)別技術(shù)前景無疑是美好的,不過,現(xiàn)階段,語音識(shí)別還受困于技術(shù)痛點(diǎn),難以大范圍應(yīng)用,主要體現(xiàn)在延時(shí)與準(zhǔn)確性兩方面。
在語音轉(zhuǎn)換成文字方面,科大訊飛等企業(yè)速度已經(jīng)比較能讓人接受了,不過在語音指令方面,Siri、微軟小娜等還會(huì)有延時(shí)的現(xiàn)象,機(jī)器理解并采取回應(yīng)的過程需要更多時(shí)間,不過一個(gè)指令需要用戶等待十秒甚至以上的,則很難被市場(chǎng)接受。
準(zhǔn)確性上,有媒體對(duì)科大訊飛的語音輸入做過實(shí)測(cè),結(jié)果顯示,在語速慢的情況下,科大訊飛語音能很快將語音準(zhǔn)確地翻譯成文字;不過,在語速快、中英文夾雜的情況下,準(zhǔn)確性有所下降。
另外,語音輸入的準(zhǔn)確性還面臨方言以及使用環(huán)境的挑戰(zhàn)。
因此,未來語音識(shí)別技術(shù)還需要在速度和準(zhǔn)確性上有所提升。尤其是準(zhǔn)確性,業(yè)界相信,當(dāng)語音識(shí)別技術(shù)準(zhǔn)確度提高到99%的時(shí)候,將會(huì)改寫當(dāng)前人機(jī)交互的規(guī)則。