當(dāng)前位置:首頁(yè) > 通信技術(shù) > 通信技術(shù)
[導(dǎo)讀]21ic通信網(wǎng)訊,如今,語(yǔ)音技術(shù)已經(jīng)成為巨頭的標(biāo)配,百度、騰訊、搜狗、云知聲它們或是傳統(tǒng)互聯(lián)網(wǎng)巨頭,或是出身中科院技術(shù)豪門。巨頭占領(lǐng)語(yǔ)音高點(diǎn)已是必然。而從去年開始語(yǔ)音市場(chǎng)受到業(yè)界關(guān)注,到今天云知聲獲得千萬(wàn)

21ic通信網(wǎng)訊,如今,語(yǔ)音技術(shù)已經(jīng)成為巨頭的標(biāo)配,百度、騰訊、搜狗、云知聲它們或是傳統(tǒng)互聯(lián)網(wǎng)巨頭,或是出身中科院技術(shù)豪門。巨頭占領(lǐng)語(yǔ)音高點(diǎn)已是必然。而從去年開始語(yǔ)音市場(chǎng)受到業(yè)界關(guān)注,到今天云知聲獲得千萬(wàn)美金融資,語(yǔ)音市場(chǎng)春天是否已經(jīng)到來(lái)?創(chuàng)業(yè)者在其中是否仍有機(jī)會(huì)?看看作者怎么說(shuō)。

大約一年前,中國(guó)移動(dòng)以13.6億人民幣的代價(jià)獲得了科大訊飛15%的股權(quán),后者股價(jià)一路攀升,從不足30元到最高61元,成為一大牛股,市值高達(dá)240多億人民幣。而在剛剛過(guò)去的長(zhǎng)假中,“云知聲”也高調(diào)宣布獲得金額為千萬(wàn)美金折合約1億元人民幣A輪融資。雖然其體量尚無(wú)法和科大相比,但這對(duì)沉寂一年的語(yǔ)音識(shí)別市場(chǎng)卻是重大利好。

而同樣涉足該領(lǐng)域的百度、騰訊、搜狗也正在加快技術(shù)迭代的腳步,作為戰(zhàn)略級(jí)標(biāo)配,語(yǔ)音技術(shù)在巨頭眼中都格外重要。與國(guó)外巨頭占領(lǐng)語(yǔ)音市場(chǎng)相似,業(yè)內(nèi)普遍認(rèn)為,受技術(shù)門檻的限制,語(yǔ)音市場(chǎng)創(chuàng)業(yè)窗口或已關(guān)閉。只屬于巨頭的語(yǔ)音戰(zhàn)國(guó)大幕拉開!

  Siri成國(guó)內(nèi)語(yǔ)音市場(chǎng)爆發(fā)導(dǎo)火索

自從蘋果Siri推出后,語(yǔ)音市場(chǎng)獲得了高度關(guān)注。人們甚至驚呼這種更自然的操控將取代鍵盤。一時(shí)間跟隨者紛紛入局。蘋果勁敵Google帶著Google Now強(qiáng)勢(shì)殺入,憑著搜索技術(shù)特長(zhǎng)和數(shù)據(jù)積累,在交互效果上略勝一籌。備受關(guān)注的Google Glass便由“Ok Google”這一酷極了的語(yǔ)音方式啟動(dòng)。

國(guó)內(nèi)互聯(lián)網(wǎng)公司百度、騰訊、盛大和搜狗均推出語(yǔ)音相關(guān)產(chǎn)品。搜狗在去年11月便推出了語(yǔ)音助手,其語(yǔ)音識(shí)別技術(shù)采用的正是“云知聲”。而采用自有語(yǔ)音識(shí)別技術(shù)的百度,在去年圣誕節(jié)期間才推出語(yǔ)音助手,比搜狗晚了1個(gè)月。

騰訊在語(yǔ)音市場(chǎng)上則保守許多,微信發(fā)家于語(yǔ)音對(duì)講機(jī),可天然地移植到語(yǔ)音助手。但除了在4.5推出“語(yǔ)音提醒”公眾號(hào)外,并未加強(qiáng)其他語(yǔ)音識(shí)別功能。這也符合騰訊一貫風(fēng)格,在模式被驗(yàn)證,市場(chǎng)被教育成熟才會(huì)發(fā)力。值得注意的是,微信自建了一個(gè)30多人的技術(shù)團(tuán)隊(duì)進(jìn)行語(yǔ)音識(shí)別技術(shù)研發(fā)。

除了百度、騰訊等巨頭,盛大推出采用自有技術(shù)的“百靈語(yǔ)音助手”。中國(guó)移動(dòng)聯(lián)手科大訊飛推出“靈犀助手”,訊飛本身還有“語(yǔ)點(diǎn)”這款語(yǔ)音助手產(chǎn)品。創(chuàng)業(yè)公司智能360、蟲洞語(yǔ)音助手、小i機(jī)器人則側(cè)重語(yǔ)義解析和前端功能。

  語(yǔ)音技術(shù)普及存在較多限制條件

語(yǔ)音哪怕Siri依然未成為主流的交互方式。國(guó)內(nèi)也尚未出現(xiàn)能與“語(yǔ)音助手”劃上等號(hào)的產(chǎn)品。去年中國(guó)語(yǔ)音市場(chǎng)經(jīng)歷了一場(chǎng)“軍備競(jìng)賽”,沒(méi)有人確定用戶是否真的需要這么個(gè)玩意兒。但如今,大家都不遺余力,生怕落后,被人搶占傳說(shuō)中的入口。

  1、“語(yǔ)音入口”可能只是傳說(shuō)。

筆者并不是馬后炮,在Siri推出時(shí)我認(rèn)為語(yǔ)音交互有天生的缺陷:只能在安靜的場(chǎng)景下使用,有噪音則難以識(shí)別;只能在私密的場(chǎng)景使用,否則語(yǔ)音命令會(huì)干擾他人?,F(xiàn)實(shí)中這類場(chǎng)所并不多,哪怕在家中客廳使用語(yǔ)音功能,也可能影響家人。

就算無(wú)干擾場(chǎng)所存在,語(yǔ)音識(shí)別技術(shù)還有一個(gè)依賴:無(wú)線網(wǎng)絡(luò)。上傳大量的數(shù)據(jù)進(jìn)行云端識(shí)別,必須有良好的網(wǎng)絡(luò)。在一些沒(méi)有WIFI的地方,使用語(yǔ)音操控簡(jiǎn)直是噩夢(mèng)。有產(chǎn)品提供離線識(shí)別技術(shù),安裝包將增大數(shù)倍,識(shí)別效果也會(huì)直線下降。

  2、語(yǔ)音產(chǎn)品的智能化技術(shù)仍差強(qiáng)人意。

語(yǔ)音市場(chǎng)更難的問(wèn)題在于“智能識(shí)別”的智能。語(yǔ)音技術(shù)分為語(yǔ)音識(shí)別、語(yǔ)義解析和語(yǔ)音合成。大多語(yǔ)音搜索產(chǎn)品能做到的僅僅是將語(yǔ)音轉(zhuǎn)換成文字,然后通過(guò)文字去搜索,實(shí)際是“語(yǔ)音識(shí)別”這部分技術(shù)應(yīng)用。語(yǔ)音助手要做到助理的程度,則需要能聽(tīng)懂人話,理解自然語(yǔ)言,就像鋼鐵俠里的賈維斯系統(tǒng)?,F(xiàn)在的“語(yǔ)音轉(zhuǎn)文字”這一步并不自然。而理解自然語(yǔ)言,依然是Google、百度等技術(shù)巨擘在攻堅(jiān)的難點(diǎn):語(yǔ)義解析。

3、用戶尚未形成習(xí)慣

最后還有一個(gè)難點(diǎn)在于用戶習(xí)慣。好的產(chǎn)品要觸及用戶,需要培養(yǎng),改變和教育。這需要時(shí)間。

目前,使用場(chǎng)景、無(wú)線網(wǎng)絡(luò)、語(yǔ)義識(shí)別和用戶習(xí)慣這些限制均使得語(yǔ)音仍處于探路期。砸入大量資源,并未獲得匹配的收獲,于是有了泡沫。

  創(chuàng)業(yè)者的時(shí)間窗口已經(jīng)過(guò)去!

如今,語(yǔ)音語(yǔ)義這塊是兵家必爭(zhēng)之地,尤其是可穿戴設(shè)備興起后,重要性更加凸顯。語(yǔ)音市場(chǎng)必將成為巨頭的游戲,技術(shù)和數(shù)據(jù)門檻高企,而語(yǔ)音創(chuàng)業(yè)的時(shí)間窗口可能已經(jīng)過(guò)去。

1、巨頭轉(zhuǎn)型速度正在加快。“云知聲”和“科大訊飛”在這些角逐者中的角色,就像地圖領(lǐng)域的高德一樣,提供數(shù)據(jù)和技術(shù)供上層服務(wù)商使用。巧合的是,科大訊飛也在謀求高德的從“B”到“C”的多元化轉(zhuǎn)型之路。除了語(yǔ)音助手,科大訊飛還推出了訊飛語(yǔ)音輸入法、面向幼兒教育的語(yǔ)音機(jī)器人硬件等產(chǎn)品。

多元化目前是語(yǔ)音巨頭們正在做的事情,也是語(yǔ)音識(shí)別平臺(tái)必須要做的事情。他們面向企業(yè)市場(chǎng)提供免費(fèi)識(shí)別技術(shù),但僅靠定制收費(fèi)是行不通的?;ヂ?lián)網(wǎng)巨頭一貫熱衷免費(fèi),走開放平臺(tái)路線,籠絡(luò)開發(fā)者進(jìn)而獲得流量、數(shù)據(jù)和個(gè)人用戶。8月底百度導(dǎo)航徹底免費(fèi),與高德導(dǎo)航正面交鋒就是活生生的例子。百度、騰訊等公司正在投入巨大的資金和資源加強(qiáng)語(yǔ)音技術(shù)建設(shè)。如果他們將語(yǔ)音識(shí)別技術(shù)免費(fèi)必然將創(chuàng)造更大的語(yǔ)音生態(tài)圈。

2、資源技術(shù)優(yōu)勢(shì)成為創(chuàng)業(yè)阻礙。事實(shí)上,語(yǔ)音業(yè)務(wù)的基礎(chǔ)是建立是在強(qiáng)技術(shù)驅(qū)動(dòng)下才能實(shí)現(xiàn)的,而目前僅有巨頭擁有相關(guān)優(yōu)勢(shì)。同時(shí),語(yǔ)音技術(shù)加上語(yǔ)義解析技術(shù),借助知識(shí)圖譜、深度學(xué)習(xí),實(shí)現(xiàn)對(duì)話式搜索,在移動(dòng)互聯(lián)網(wǎng)時(shí)代可以爆發(fā)出巨大能量,也更容易落地和商業(yè)化。單純提供語(yǔ)音識(shí)別技術(shù),做一個(gè)技術(shù)平臺(tái),商業(yè)化是個(gè)大問(wèn)題。而百度等互聯(lián)網(wǎng)巨頭在垂直整合上相比專業(yè)領(lǐng)域的創(chuàng)業(yè)者,更有優(yōu)勢(shì)。

語(yǔ)音市場(chǎng)的春天正在到來(lái)?

或許,上述問(wèn)題會(huì)長(zhǎng)期存在,但不可否認(rèn)的是,語(yǔ)音作為移動(dòng)互聯(lián)網(wǎng)的前沿技術(shù)仍值得業(yè)界期待。

就使用場(chǎng)景而言,Glass的“Ok Google”是個(gè)開始。樂(lè)視TV、錘子OS、易信、inWatch、小米3等產(chǎn)品紛紛推出語(yǔ)音交互功能,均采用了云知聲或者訊飛這兩家公司的技術(shù)??纱┐髟O(shè)備的興起,硬件創(chuàng)業(yè)的浪潮會(huì)帶來(lái)更多的語(yǔ)音交互使用的土壤。[!--empirenews.page--]

對(duì)于環(huán)境噪音的干擾,百度負(fù)責(zé)多媒體搜索技術(shù)的余凱博士在幾個(gè)月前曾向筆者解釋過(guò)抗噪技術(shù),語(yǔ)音識(shí)別技術(shù)已經(jīng)進(jìn)化到可以區(qū)分人聲和環(huán)境噪聲,甚至可以根據(jù)聲紋識(shí)別某個(gè)人的特定聲音。這個(gè)技術(shù)還可以應(yīng)用于移動(dòng)支付。支付寶已推出利用聲音指紋的“聲波支付”。這也說(shuō)明語(yǔ)音技術(shù)的使用場(chǎng)景只會(huì)被越來(lái)越多地發(fā)掘。

例如企業(yè)客服。今日便有消息稱科大訊飛與安徽移動(dòng)簽下一筆近千萬(wàn)的大單。相對(duì)中移動(dòng),千萬(wàn)規(guī)模委實(shí)不算大單。但他們的合作內(nèi)容或?qū)⒁l(fā)新的企業(yè)Call Center的升級(jí)換代:后期中國(guó)移動(dòng)在客服10086平臺(tái)將采用訊飛的智能語(yǔ)音技術(shù),用戶可以直接說(shuō)出需求??头穆曇粢矔?huì)采用語(yǔ)音合成技術(shù),這是科大訊飛的優(yōu)勢(shì),其語(yǔ)音合成甚至可以支持主流方言。受此消息影響,今日科大訊飛股票漲停。

無(wú)線網(wǎng)絡(luò)的環(huán)境改善也是利好消息。4G牌照已是弦上之箭,不得不發(fā)。筆者近日拿到中國(guó)移動(dòng)4G(TD-LTE)上網(wǎng)卡測(cè)試顯示,4G網(wǎng)絡(luò)在單用戶使用時(shí)帶寬已高達(dá)44M,下載速度為4MB/S。用戶多了這個(gè)速度會(huì)受到影響,不過(guò)可以預(yù)見(jiàn)4G相比3G時(shí)代已經(jīng)不可同日而語(yǔ)。除了4G,運(yùn)營(yíng)商、政府和商家對(duì)WIFI的投資熱情也帶來(lái)了覆蓋更廣的無(wú)線熱點(diǎn)。

最后,誰(shuí)將成為中國(guó)的Nuance還尚無(wú)定論。但這一市場(chǎng)已經(jīng)帶給了眾多從業(yè)者無(wú)限的想象空間,可以預(yù)見(jiàn),未來(lái)語(yǔ)音市場(chǎng)的將在巨頭的你爭(zhēng)我?jiàn)Z中成為業(yè)界焦點(diǎn),而下游的語(yǔ)音產(chǎn)品也隨之將逐漸豐富,一個(gè)移動(dòng)語(yǔ)音生態(tài)生態(tài)或?qū)⒃诓痪煤笮纬?....

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉