語(yǔ)音巨頭時(shí)代來(lái)臨!誰(shuí)將是中國(guó)Siri?
掃描二維碼
隨時(shí)隨地手機(jī)看文章
21ic通信網(wǎng)訊,如今,語(yǔ)音技術(shù)已經(jīng)成為巨頭的標(biāo)配,百度、騰訊、搜狗、云知聲它們或是傳統(tǒng)互聯(lián)網(wǎng)巨頭,或是出身中科院技術(shù)豪門。巨頭占領(lǐng)語(yǔ)音高點(diǎn)已是必然。而從去年開始語(yǔ)音市場(chǎng)受到業(yè)界關(guān)注,到今天云知聲獲得千萬(wàn)美金融資,語(yǔ)音市場(chǎng)春天是否已經(jīng)到來(lái)?創(chuàng)業(yè)者在其中是否仍有機(jī)會(huì)?看看作者怎么說(shuō)。
大約一年前,中國(guó)移動(dòng)以13.6億人民幣的代價(jià)獲得了科大訊飛15%的股權(quán),后者股價(jià)一路攀升,從不足30元到最高61元,成為一大牛股,市值高達(dá)240多億人民幣。而在剛剛過(guò)去的長(zhǎng)假中,“云知聲”也高調(diào)宣布獲得金額為千萬(wàn)美金折合約1億元人民幣A輪融資。雖然其體量尚無(wú)法和科大相比,但這對(duì)沉寂一年的語(yǔ)音識(shí)別市場(chǎng)卻是重大利好。
而同樣涉足該領(lǐng)域的百度、騰訊、搜狗也正在加快技術(shù)迭代的腳步,作為戰(zhàn)略級(jí)標(biāo)配,語(yǔ)音技術(shù)在巨頭眼中都格外重要。與國(guó)外巨頭占領(lǐng)語(yǔ)音市場(chǎng)相似,業(yè)內(nèi)普遍認(rèn)為,受技術(shù)門檻的限制,語(yǔ)音市場(chǎng)創(chuàng)業(yè)窗口或已關(guān)閉。只屬于巨頭的語(yǔ)音戰(zhàn)國(guó)大幕拉開!
Siri成國(guó)內(nèi)語(yǔ)音市場(chǎng)爆發(fā)導(dǎo)火索
自從蘋果Siri推出后,語(yǔ)音市場(chǎng)獲得了高度關(guān)注。人們甚至驚呼這種更自然的操控將取代鍵盤。一時(shí)間跟隨者紛紛入局。蘋果勁敵Google帶著Google Now強(qiáng)勢(shì)殺入,憑著搜索技術(shù)特長(zhǎng)和數(shù)據(jù)積累,在交互效果上略勝一籌。備受關(guān)注的Google Glass便由“Ok Google”這一酷極了的語(yǔ)音方式啟動(dòng)。
國(guó)內(nèi)互聯(lián)網(wǎng)公司百度、騰訊、盛大和搜狗均推出語(yǔ)音相關(guān)產(chǎn)品。搜狗在去年11月便推出了語(yǔ)音助手,其語(yǔ)音識(shí)別技術(shù)采用的正是“云知聲”。而采用自有語(yǔ)音識(shí)別技術(shù)的百度,在去年圣誕節(jié)期間才推出語(yǔ)音助手,比搜狗晚了1個(gè)月。
騰訊在語(yǔ)音市場(chǎng)上則保守許多,微信發(fā)家于語(yǔ)音對(duì)講機(jī),可天然地移植到語(yǔ)音助手。但除了在4.5推出“語(yǔ)音提醒”公眾號(hào)外,并未加強(qiáng)其他語(yǔ)音識(shí)別功能。這也符合騰訊一貫風(fēng)格,在模式被驗(yàn)證,市場(chǎng)被教育成熟才會(huì)發(fā)力。值得注意的是,微信自建了一個(gè)30多人的技術(shù)團(tuán)隊(duì)進(jìn)行語(yǔ)音識(shí)別技術(shù)研發(fā)。
除了百度、騰訊等巨頭,盛大推出采用自有技術(shù)的“百靈語(yǔ)音助手”。中國(guó)移動(dòng)聯(lián)手科大訊飛推出“靈犀助手”,訊飛本身還有“語(yǔ)點(diǎn)”這款語(yǔ)音助手產(chǎn)品。創(chuàng)業(yè)公司智能360、蟲洞語(yǔ)音助手、小i機(jī)器人則側(cè)重語(yǔ)義解析和前端功能。
語(yǔ)音技術(shù)普及存在較多限制條件
語(yǔ)音哪怕Siri依然未成為主流的交互方式。國(guó)內(nèi)也尚未出現(xiàn)能與“語(yǔ)音助手”劃上等號(hào)的產(chǎn)品。去年中國(guó)語(yǔ)音市場(chǎng)經(jīng)歷了一場(chǎng)“軍備競(jìng)賽”,沒(méi)有人確定用戶是否真的需要這么個(gè)玩意兒。但如今,大家都不遺余力,生怕落后,被人搶占傳說(shuō)中的入口。
1、“語(yǔ)音入口”可能只是傳說(shuō)。
筆者并不是馬后炮,在Siri推出時(shí)我認(rèn)為語(yǔ)音交互有天生的缺陷:只能在安靜的場(chǎng)景下使用,有噪音則難以識(shí)別;只能在私密的場(chǎng)景使用,否則語(yǔ)音命令會(huì)干擾他人?,F(xiàn)實(shí)中這類場(chǎng)所并不多,哪怕在家中客廳使用語(yǔ)音功能,也可能影響家人。
就算無(wú)干擾場(chǎng)所存在,語(yǔ)音識(shí)別技術(shù)還有一個(gè)依賴:無(wú)線網(wǎng)絡(luò)。上傳大量的數(shù)據(jù)進(jìn)行云端識(shí)別,必須有良好的網(wǎng)絡(luò)。在一些沒(méi)有WIFI的地方,使用語(yǔ)音操控簡(jiǎn)直是噩夢(mèng)。有產(chǎn)品提供離線識(shí)別技術(shù),安裝包將增大數(shù)倍,識(shí)別效果也會(huì)直線下降。
2、語(yǔ)音產(chǎn)品的智能化技術(shù)仍差強(qiáng)人意。
語(yǔ)音市場(chǎng)更難的問(wèn)題在于“智能識(shí)別”的智能。語(yǔ)音技術(shù)分為語(yǔ)音識(shí)別、語(yǔ)義解析和語(yǔ)音合成。大多語(yǔ)音搜索產(chǎn)品能做到的僅僅是將語(yǔ)音轉(zhuǎn)換成文字,然后通過(guò)文字去搜索,實(shí)際是“語(yǔ)音識(shí)別”這部分技術(shù)應(yīng)用。語(yǔ)音助手要做到助理的程度,則需要能聽(tīng)懂人話,理解自然語(yǔ)言,就像鋼鐵俠里的賈維斯系統(tǒng)?,F(xiàn)在的“語(yǔ)音轉(zhuǎn)文字”這一步并不自然。而理解自然語(yǔ)言,依然是Google、百度等技術(shù)巨擘在攻堅(jiān)的難點(diǎn):語(yǔ)義解析。
3、用戶尚未形成習(xí)慣
最后還有一個(gè)難點(diǎn)在于用戶習(xí)慣。好的產(chǎn)品要觸及用戶,需要培養(yǎng),改變和教育。這需要時(shí)間。
目前,使用場(chǎng)景、無(wú)線網(wǎng)絡(luò)、語(yǔ)義識(shí)別和用戶習(xí)慣這些限制均使得語(yǔ)音仍處于探路期。砸入大量資源,并未獲得匹配的收獲,于是有了泡沫。
創(chuàng)業(yè)者的時(shí)間窗口已經(jīng)過(guò)去!
如今,語(yǔ)音語(yǔ)義這塊是兵家必爭(zhēng)之地,尤其是可穿戴設(shè)備興起后,重要性更加凸顯。語(yǔ)音市場(chǎng)必將成為巨頭的游戲,技術(shù)和數(shù)據(jù)門檻高企,而語(yǔ)音創(chuàng)業(yè)的時(shí)間窗口可能已經(jīng)過(guò)去。
1、巨頭轉(zhuǎn)型速度正在加快。“云知聲”和“科大訊飛”在這些角逐者中的角色,就像地圖領(lǐng)域的高德一樣,提供數(shù)據(jù)和技術(shù)供上層服務(wù)商使用。巧合的是,科大訊飛也在謀求高德的從“B”到“C”的多元化轉(zhuǎn)型之路。除了語(yǔ)音助手,科大訊飛還推出了訊飛語(yǔ)音輸入法、面向幼兒教育的語(yǔ)音機(jī)器人硬件等產(chǎn)品。
多元化目前是語(yǔ)音巨頭們正在做的事情,也是語(yǔ)音識(shí)別平臺(tái)必須要做的事情。他們面向企業(yè)市場(chǎng)提供免費(fèi)識(shí)別技術(shù),但僅靠定制收費(fèi)是行不通的?;ヂ?lián)網(wǎng)巨頭一貫熱衷免費(fèi),走開放平臺(tái)路線,籠絡(luò)開發(fā)者進(jìn)而獲得流量、數(shù)據(jù)和個(gè)人用戶。8月底百度導(dǎo)航徹底免費(fèi),與高德導(dǎo)航正面交鋒就是活生生的例子。百度、騰訊等公司正在投入巨大的資金和資源加強(qiáng)語(yǔ)音技術(shù)建設(shè)。如果他們將語(yǔ)音識(shí)別技術(shù)免費(fèi)必然將創(chuàng)造更大的語(yǔ)音生態(tài)圈。
2、資源技術(shù)優(yōu)勢(shì)成為創(chuàng)業(yè)阻礙。事實(shí)上,語(yǔ)音業(yè)務(wù)的基礎(chǔ)是建立是在強(qiáng)技術(shù)驅(qū)動(dòng)下才能實(shí)現(xiàn)的,而目前僅有巨頭擁有相關(guān)優(yōu)勢(shì)。同時(shí),語(yǔ)音技術(shù)加上語(yǔ)義解析技術(shù),借助知識(shí)圖譜、深度學(xué)習(xí),實(shí)現(xiàn)對(duì)話式搜索,在移動(dòng)互聯(lián)網(wǎng)時(shí)代可以爆發(fā)出巨大能量,也更容易落地和商業(yè)化。單純提供語(yǔ)音識(shí)別技術(shù),做一個(gè)技術(shù)平臺(tái),商業(yè)化是個(gè)大問(wèn)題。而百度等互聯(lián)網(wǎng)巨頭在垂直整合上相比專業(yè)領(lǐng)域的創(chuàng)業(yè)者,更有優(yōu)勢(shì)。
語(yǔ)音市場(chǎng)的春天正在到來(lái)?
或許,上述問(wèn)題會(huì)長(zhǎng)期存在,但不可否認(rèn)的是,語(yǔ)音作為移動(dòng)互聯(lián)網(wǎng)的前沿技術(shù)仍值得業(yè)界期待。
就使用場(chǎng)景而言,Glass的“Ok Google”是個(gè)開始。樂(lè)視TV、錘子OS、易信、inWatch、小米3等產(chǎn)品紛紛推出語(yǔ)音交互功能,均采用了云知聲或者訊飛這兩家公司的技術(shù)??纱┐髟O(shè)備的興起,硬件創(chuàng)業(yè)的浪潮會(huì)帶來(lái)更多的語(yǔ)音交互使用的土壤。[!--empirenews.page--]
對(duì)于環(huán)境噪音的干擾,百度負(fù)責(zé)多媒體搜索技術(shù)的余凱博士在幾個(gè)月前曾向筆者解釋過(guò)抗噪技術(shù),語(yǔ)音識(shí)別技術(shù)已經(jīng)進(jìn)化到可以區(qū)分人聲和環(huán)境噪聲,甚至可以根據(jù)聲紋識(shí)別某個(gè)人的特定聲音。這個(gè)技術(shù)還可以應(yīng)用于移動(dòng)支付。支付寶已推出利用聲音指紋的“聲波支付”。這也說(shuō)明語(yǔ)音技術(shù)的使用場(chǎng)景只會(huì)被越來(lái)越多地發(fā)掘。
例如企業(yè)客服。今日便有消息稱科大訊飛與安徽移動(dòng)簽下一筆近千萬(wàn)的大單。相對(duì)中移動(dòng),千萬(wàn)規(guī)模委實(shí)不算大單。但他們的合作內(nèi)容或?qū)⒁l(fā)新的企業(yè)Call Center的升級(jí)換代:后期中國(guó)移動(dòng)在客服10086平臺(tái)將采用訊飛的智能語(yǔ)音技術(shù),用戶可以直接說(shuō)出需求??头穆曇粢矔?huì)采用語(yǔ)音合成技術(shù),這是科大訊飛的優(yōu)勢(shì),其語(yǔ)音合成甚至可以支持主流方言。受此消息影響,今日科大訊飛股票漲停。
無(wú)線網(wǎng)絡(luò)的環(huán)境改善也是利好消息。4G牌照已是弦上之箭,不得不發(fā)。筆者近日拿到中國(guó)移動(dòng)4G(TD-LTE)上網(wǎng)卡測(cè)試顯示,4G網(wǎng)絡(luò)在單用戶使用時(shí)帶寬已高達(dá)44M,下載速度為4MB/S。用戶多了這個(gè)速度會(huì)受到影響,不過(guò)可以預(yù)見(jiàn)4G相比3G時(shí)代已經(jīng)不可同日而語(yǔ)。除了4G,運(yùn)營(yíng)商、政府和商家對(duì)WIFI的投資熱情也帶來(lái)了覆蓋更廣的無(wú)線熱點(diǎn)。
最后,誰(shuí)將成為中國(guó)的Nuance還尚無(wú)定論。但這一市場(chǎng)已經(jīng)帶給了眾多從業(yè)者無(wú)限的想象空間,可以預(yù)見(jiàn),未來(lái)語(yǔ)音市場(chǎng)的將在巨頭的你爭(zhēng)我?jiàn)Z中成為業(yè)界焦點(diǎn),而下游的語(yǔ)音產(chǎn)品也隨之將逐漸豐富,一個(gè)移動(dòng)語(yǔ)音生態(tài)生態(tài)或?qū)⒃诓痪煤笮纬?....