一家獨(dú)大到三足鼎立,智能語音發(fā)展格局悄悄改變
12月初發(fā)布的《2017-2018中國(guó)智能語音產(chǎn)業(yè)白皮書》顯示,2014年至2018年,中國(guó)智能語音產(chǎn)業(yè)規(guī)模由30億元增長(zhǎng)至159.7億元,增速高達(dá)530%。雖然,科大訊飛和百度分別以44.20%和27.80%占據(jù)市場(chǎng)份額前兩位,但仍在這一不斷極速擴(kuò)張的浪潮中不斷迎來新晉者的挑戰(zhàn),而產(chǎn)業(yè)格局也正在悄悄發(fā)生變化,向更多極化發(fā)展。
智能語音市場(chǎng)的“三大拍案驚奇”
中國(guó)的智能語音市場(chǎng)很怪,明明每家企業(yè)都說自己的產(chǎn)品準(zhǔn)確率很高,但是誰也不敢明確自己就是第一。不但沒有統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),就連自己的測(cè)試標(biāo)準(zhǔn)也完全不公開,成為一大拍案驚奇;
拍案驚奇二,雖說各家做語音的時(shí)間有長(zhǎng)有短,然而技術(shù)層面并沒有拉開差距。久到深耕行業(yè)近二十年的科大訊飛,近到語音行業(yè)新秀云知聲、依圖科技,同樣都在數(shù)據(jù)方面達(dá)到了一個(gè)相似的百分比。綜合技術(shù)數(shù)據(jù)和應(yīng)用效果來看,各家企業(yè)非但沒有拉開明顯差距,連究竟孰高孰低竟也不太好分辨;
拍案驚奇三,與市場(chǎng)的一片繁榮相比,智能語音產(chǎn)品非常繁雜,但使用體驗(yàn)、終端用戶的接受程度和商業(yè)市場(chǎng)的變現(xiàn)能力卻一直和行業(yè)預(yù)期存在差距,特別是消費(fèi)者似乎對(duì)于智能語音產(chǎn)品并不感冒,這并非是使用習(xí)慣一個(gè)方面的原因。
智能語音市場(chǎng)正迎來“三足鼎立”新格局
作為大哥和二哥的訊飛和百度,既然無法短時(shí)間內(nèi)解決“三大拍案驚奇”,市場(chǎng)會(huì)自然的引入新力量來平衡和解決怪現(xiàn)象。而在短期內(nèi)可以看到的變化,即是智能語音市場(chǎng)將會(huì)迎來“三類玩家”新格局:干的最早的訊飛,家底最厚的BAT,以及實(shí)力黑馬的新秀。
玩家一:“大師兄”科大訊飛
跑在第一名的,永遠(yuǎn)會(huì)有被趕超的壓力。在智能語音領(lǐng)域,科大訊飛就是這樣。作為中國(guó)智能語音的奠基者,訊飛以19年的行業(yè)深耕,做出了大量的數(shù)據(jù)積累和行業(yè)經(jīng)驗(yàn),使其在中文語音合成、語音識(shí)別、口語評(píng)測(cè)等多項(xiàng)技術(shù)上都擁有國(guó)際領(lǐng)先的成果。
但百密一疏的是,訊飛并沒有用技術(shù)和應(yīng)用成果,打造出有效的行業(yè)壁壘,并以“老大哥”的身份樹立中文智能語音行業(yè)的標(biāo)準(zhǔn),構(gòu)建明確的行業(yè)準(zhǔn)入門檻。否則,可能也就不會(huì)有憑借體量?jī)?yōu)勢(shì)來彌補(bǔ)技術(shù)上差距去硬搶老二位置的百度了。
玩家二:流量派BAT
憑借在互聯(lián)網(wǎng)時(shí)代積累的大量資本,BAT在每個(gè)科技領(lǐng)域都可以稱為“玩家”。但是,與依靠人工智能技術(shù)起家,做應(yīng)用,打市場(chǎng)的AI垂直類企業(yè)不同,BAT更多的是以流量導(dǎo)向和滿足龐大用戶群體驗(yàn)和創(chuàng)新需求為導(dǎo)向去做AI開發(fā)。更形象點(diǎn)來說,在AI這個(gè)領(lǐng)域,AI垂直企業(yè)是“技工貿(mào)”企業(yè),而BAT是“貿(mào)工技”企業(yè)。
既然有如此差別,那么就可以很清晰的看出,以流量和用戶體驗(yàn)為導(dǎo)向的BAT解決的是錦上添花的市場(chǎng)需求,并非雪中送炭的強(qiáng)需求,通俗來說BAT玩語音可能不會(huì)很認(rèn)真。
玩家三:技術(shù)黑馬依圖、云知聲
最近,AI公司依圖科技,宣布進(jìn)入語音市場(chǎng),并且在最權(quán)威的中文數(shù)據(jù)集AISHELL-2中達(dá)到了96.29%的準(zhǔn)確度,成為業(yè)內(nèi)第一個(gè)敢于亮出測(cè)試數(shù)據(jù)集標(biāo)準(zhǔn)的企業(yè),并且用“實(shí)力”而不是“數(shù)字”領(lǐng)先所有其他廠商。
依圖科技科學(xué)家認(rèn)為:語音識(shí)別的準(zhǔn)確程度存在著兩條“紅線”,代表著實(shí)際應(yīng)用的兩道門檻。一條為字錯(cuò)率15%的紅線,超過這條紅線,應(yīng)用的感受度極差,可以稱作不可用。而另一條則是3%的紅線,小于這條紅線的水平在實(shí)際應(yīng)用可以滿足大部分的日常需要,而目前距離這條紅線、尤其是在復(fù)雜場(chǎng)景的情況下,還相距甚遠(yuǎn)。
智能語音從技術(shù)突破開始,到應(yīng)用、終端和場(chǎng)景的不斷突破,再到回歸技術(shù),漸成業(yè)內(nèi)共識(shí)。應(yīng)用、終端和場(chǎng)景帶來的大量應(yīng)用數(shù)據(jù),更為機(jī)器學(xué)習(xí)、深度學(xué)習(xí)帶來了技術(shù)突破的充分土壤,這也是為什么以依圖科技為代表的技術(shù)型公司能夠在智能語音領(lǐng)域快速趕超的原因所在。同時(shí),語義識(shí)別的加入、知識(shí)圖譜的構(gòu)建和技術(shù)的快速迭代,也為智能語音技術(shù)進(jìn)入3%紅線、甚至達(dá)到更高識(shí)別率帶來可能。
云知聲創(chuàng)始人梁家恩也認(rèn)為,目前還沒有一個(gè)較為成功的語音產(chǎn)品,真正的語音產(chǎn)品尚未出現(xiàn)。國(guó)外諸多廠商如谷歌,蘋果也都認(rèn)為語音行業(yè)的發(fā)展和變現(xiàn)還有很長(zhǎng)的路要走。
技術(shù),場(chǎng)景與流量,是決定整個(gè)語音領(lǐng)域走向的三大要素:技術(shù)決定場(chǎng)景應(yīng)用的革新性和深度,場(chǎng)景決定資本和應(yīng)用的流向,流量決定整個(gè)行業(yè)發(fā)展的廣度。對(duì)行業(yè)水平的三個(gè)拷問一方面指出目前行業(yè)的存在的不確定性,另一方面解決三個(gè)問題也將為行業(yè)的發(fā)展帶來新的機(jī)遇。
在語音識(shí)別發(fā)展的道路上,老玩家與新黑馬必會(huì)在全新的賽道上一較高下,而決定這場(chǎng)比賽勝負(fù)的關(guān)鍵,也許就在今天行業(yè)的浪潮之中。