智能語音巨頭們,大數(shù)據(jù)積累上慢一步!
11月21日至11月23日,搜狗語音、百度語音、科大訊飛排隊(duì)召開發(fā)布會(huì)。除了三家都默契地公布語音識(shí)別準(zhǔn)確率在97%以外,更值得一看的是他們?cè)跇?gòu)建大數(shù)據(jù)壁壘上的競(jìng)賽。
昨天的百度語音在開放平臺(tái)三周年會(huì)上,開放了新的語音技術(shù)——包括情感合成、遠(yuǎn)場(chǎng)方案、喚醒二期、長(zhǎng)語音方案——并宣稱為開發(fā)者提供免費(fèi)的接入接口。遠(yuǎn)程方案技術(shù)都是今年智能語音廠商扎堆推動(dòng)的技術(shù)突破。而今年早些時(shí)候,百度還免費(fèi)開放了語音喚醒和自定義語音技術(shù)。
在AI市場(chǎng)的爭(zhēng)奪戰(zhàn)役中,語音的戰(zhàn)略地位類似于關(guān)口。它是一種入口級(jí)、且目前最自然的人機(jī)交互手段。近年來智能語音巨頭一直在接入開發(fā)者和合作伙伴,擴(kuò)充數(shù)據(jù)庫,不過見諸報(bào)端的比拼更多還處于實(shí)驗(yàn)室和技術(shù)賽場(chǎng)。但2016年,火藥味已經(jīng)蔓延到普通個(gè)人用戶觸手可及的范圍,就比如輸入法。
更多人跟朋友微信聊天、或通過手機(jī)里的APP選擇服務(wù)時(shí),已經(jīng)不再單一地通過九宮格漢語拼音或手寫服務(wù),而是說出一句話,看著它在屏幕上實(shí)時(shí)轉(zhuǎn)成文字。這背后時(shí)輸入法市場(chǎng)前三位企業(yè)搜狗、百度和訊飛的推動(dòng)。
不過輸入法只是一方面。作為底層技術(shù),智能語音未來的發(fā)揮空間,將廣泛出現(xiàn)在手機(jī)、智能家庭、車載、醫(yī)療、教育、司法等各種場(chǎng)景。至于這將意味著多大的市場(chǎng)規(guī)模?根據(jù)國(guó)際市場(chǎng)研究公司Research and Markets日前發(fā)布的《全球及中國(guó)語音產(chǎn)業(yè)報(bào)告,2015-2020》報(bào)告,未來五年語音市場(chǎng)顯著增長(zhǎng),到2020年,全球語音市場(chǎng)規(guī)模預(yù)計(jì)將達(dá)到191.7億美元。
報(bào)告同時(shí)稱,2015年全球智能語音市場(chǎng)規(guī)模為61.9億美元,除了領(lǐng)頭羊Nuance占據(jù)三成的市場(chǎng),谷歌、微軟、蘋果和科大訊飛迅速增長(zhǎng),全球市場(chǎng)份額占比分別為20.7%、13.4%、12.9%和6.7%。
但語音技術(shù)要在現(xiàn)實(shí)生活中落地,必須與場(chǎng)景結(jié)合,這需要吸納來自各種場(chǎng)景的數(shù)據(jù)去訓(xùn)練語音技術(shù),讓其更加智能化。這也是為什么微軟小冰每周都要上線新功能,努力刺激用戶貢獻(xiàn)更多聊天數(shù)據(jù),而科大訊飛則不斷擴(kuò)大同長(zhǎng)虹等智能電視廠商的合作名單,吸納來自入口級(jí)硬件的數(shù)據(jù)。
百度同理。在百度生態(tài)內(nèi)部,目前語音技術(shù)的落地滲透在百度地圖、手機(jī)百度、百度輸入法等產(chǎn)品中。而在外部,截至今年年中,使用百度語音的App數(shù)量超過8萬,大型合作廠商包括聯(lián)想、中興、魅族、聯(lián)想、康佳、SONY、特斯拉、比亞迪等、惠普、三諾、艾米通訊等。
百度語音如今能獲取的數(shù)據(jù)規(guī)模有多大?百度首席科學(xué)家吳恩達(dá)透露了最新數(shù)據(jù)——注冊(cè)開發(fā)者數(shù)量達(dá)到14億,在線識(shí)別請(qǐng)求量2016年每天達(dá)到1.4億次,在線語音合成請(qǐng)求量則達(dá)到2億次。對(duì)比科大訊飛今天公布的數(shù)據(jù),目前人工智能云平臺(tái)總用戶數(shù)8.9億,而與訊飛人工智能連接的應(yīng)用,日均訪問量為30億次(一人用一次,計(jì)為一人次)。
隨著這些數(shù)據(jù)的輸入,每分每秒,AI的模型會(huì)迅速迭代和升級(jí)。就像谷歌的AlphaGo在每一場(chǎng)棋局的每一步對(duì)決中都在學(xué)習(xí)。
對(duì)于智能語音巨頭們而言,大數(shù)據(jù)積累上慢一步,智能化上也相應(yīng)慢一截。如果O2O市場(chǎng)的圈地比的是燒錢,那么智能語音的圈地恐怕比得是比錢更貴的東西——時(shí)間。