智能語音產(chǎn)業(yè)規(guī)模達101.4億 人機交互的未來趨勢
21ic通信網(wǎng)訊,近日,由工業(yè)和信息化部電子科學技術(shù)情報所洪京一所長代表聯(lián)盟秘書處單位發(fā)布的《2013中國智能語音產(chǎn)業(yè)發(fā)展白皮書》指出,智能語音已經(jīng)進入快速應(yīng)用階段,預計到2017年,產(chǎn)業(yè)規(guī)模將達到101.4億元。而語音作為人類溝通和獲取信息最自然最便捷的方式,勢必會成為人機交互的未來趨勢。
智能語音開啟移動互聯(lián)網(wǎng)發(fā)展新時代
隨著移動互聯(lián)網(wǎng)時代的來臨,智能語音作為信息交互的重要入口之一,成為各大手機制造商、運營商和互聯(lián)網(wǎng)企業(yè)等巨頭爭相搶占的制高點。在過去的三年中,全球智能語音市場不斷擴大。日前,微軟也亮出其智能語音技術(shù)的最新成果:“實時語音翻譯系統(tǒng)”和“基于Kinect的手語翻譯系統(tǒng)”。此前,在“百度世界2013”大會上,百度宣布向開發(fā)者免費開放整個語音識別平臺。
事實上,智能語音產(chǎn)業(yè)主要指通過語音合成技術(shù)和語音識別技術(shù),為用戶提供各種服務(wù)的產(chǎn)業(yè)。一般來說,用戶只需要用說話的方式給服務(wù)終端發(fā)布命令,就能得到相應(yīng)的服務(wù)。智能語音交互首先改變的是移動互聯(lián)網(wǎng)。以iPhone中內(nèi)置的Siri為例,用戶以自然語言的方式對智能手機下達指令,而手機根據(jù)用戶語音和用戶當前的環(huán)境及上下文對用戶意圖進行理解,并按照用戶意圖執(zhí)行命令的過程。
盡管目前智能語音產(chǎn)業(yè)規(guī)模相對較小,但業(yè)內(nèi)人士普遍認為,語音技術(shù)在兩三年內(nèi),會徹底改變當前的人機交互方式。移動互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)技術(shù)的飛速發(fā)展,智能語音已由技術(shù)研發(fā)進入快速應(yīng)用階段,產(chǎn)業(yè)規(guī)模大幅提升。根據(jù)工業(yè)和信息化部電子科學技術(shù)情報研究所數(shù)據(jù),2012年全球智能語音產(chǎn)業(yè)規(guī)模整體達到24.4億美元,同比增長24.0%。其中,中國智能語音產(chǎn)業(yè)規(guī)模近8.6億元,同比增長38.2%,帶動移動互聯(lián)網(wǎng)、智能家電、教育等相關(guān)產(chǎn)業(yè)規(guī)模增長100億元。
智能語音應(yīng)用漸成信息消費熱點
目前,在全球電子設(shè)備制造業(yè)中,微型電聲元器件的應(yīng)用較為廣泛,隨著下游手機、筆記本電腦、平板電視、數(shù)碼相機等個人消費類電子產(chǎn)品的持續(xù)發(fā)展,其市場需求將不斷快速增長。百度多媒體負責人余凱曾表示“如今的語音搜索不同于傳統(tǒng)搜索模式,不是基于無關(guān)聯(lián)的幾個關(guān)鍵詞來反饋結(jié)果,而是能夠理解用戶指令,完成一項完整的任務(wù)。”基于此,語音必將成為日后移動互聯(lián)網(wǎng)的入口之一。
智能語音技術(shù)發(fā)展至今,市場上也涌現(xiàn)出越來越多的語音識別軟件,如語音類搜索應(yīng)用Dragon Search、語音類聽寫功能整合軟件訊飛口訊、語音類音樂軟件Shazam、口語在線學習平臺思必馳AIChinese,以及語音控制軟件Siri等。在國外語音市場主要以語音識別為主,具有代表性的產(chǎn)品有Nuance的Dragon Dictation,蘋果新推出的Siri;而在國內(nèi),語音市場主要以語音合成為主,其中科大訊飛及捷通華聲基本占領(lǐng)了語音合成市場。
12市場規(guī)模的大幅提升為行業(yè)企業(yè)提供了巨大的市場空間。微信的微語音插件、搜狗語音助手、易信等,都采用了語音識別應(yīng)用。另外,電視和機頂盒也是采用智能語音交互比較積極的行業(yè)。傳統(tǒng)的電視機和機頂盒的遙控操作都比較復雜,而采用智能語音交互技術(shù),只需對著遙控器說話,就可以控制電視,輸入文字、打開應(yīng)用、播放視頻都可輕松實現(xiàn)。汽車、玩具、穿戴設(shè)備也都對智能交互技術(shù)能提供的全新交互方式抱有很大的期待。語音技術(shù)作為一個已經(jīng)漸漸成熟的基礎(chǔ)技術(shù),用戶認知度和市場規(guī)模也正在逐漸擴大。
智能語音產(chǎn)業(yè)如何破解技術(shù)壁壘?
雖然人工智能技術(shù)是從計算機出現(xiàn)以來就開始研究,但智能語音離實際應(yīng)用還有相當?shù)木嚯x,路還很長。據(jù)易觀智庫發(fā)布的數(shù)據(jù)顯示,語音助手類應(yīng)用累積下載量排行中,沖動語音助手以29.8%占比第一,其次是智能360占25.2%,而科大訊飛旗下的訊飛語點由于靈犀的分流,排名第三,占到20.1%。據(jù)蟲洞語音助手創(chuàng)始團隊成員王向一透露,目前蟲洞語音助手總用戶為1600萬。按比例計算,國內(nèi)所有語音助手總每月下載量僅為4442萬,用戶量總和僅5000萬。
此外,一份國外最新的調(diào)查顯示,截至目前,約有85%的iOS 7用戶從未使用過Siri,在使用Siri的用戶中,有46%的用戶感到失望,認為Ssiri發(fā)揮的實際作用不大。這些數(shù)據(jù)都可以看出,智能語音技術(shù)離實際應(yīng)用還很遠。當前,智能語音類應(yīng)用在語音識別,語義解析,內(nèi)容問答等方面存在較大的技術(shù)壁壘。在全球范圍內(nèi),將此技術(shù)與商業(yè)化完美結(jié)合的廠商也是寥寥無幾。人機交互式的語音技術(shù)僅是在諸如輸入法等產(chǎn)品中充當配角,真正的語音產(chǎn)品形態(tài)尚未出現(xiàn)。
目前還沒有一個較為成功的前端語音產(chǎn)品可以主宰市場,功能上的同質(zhì)化、用戶體驗的不流暢、語音識別的準確率不高等等問題嚴重影響其發(fā)展。如何突破技術(shù)壁壘實行商業(yè)化運作將是智能語音規(guī)模普及的關(guān)鍵。因此,在未來發(fā)展過程中,廠商仍應(yīng)加強語音操控功能的技術(shù)完善。另外,還應(yīng)著眼于提升用戶的綜合使用體驗,而不僅僅是技術(shù)層面的應(yīng)用,切忌陷入單純的技術(shù)比拼怪圈。
12