當前位置:首頁 > 消費電子 > 消費電子
[導讀] 近年來智能語音市場的火熱,引起了越來越多的人的關(guān)注。最明顯的標志,就是科大訊飛的市值。作為語音行業(yè)的龍頭企業(yè),短短幾年時間,科大訊飛的市值從剛上市時的34億,已經(jīng)增長到超過200億,讓人瞠目結(jié)舌。而這幾年

 近年來智能語音市場的火熱,引起了越來越多的人的關(guān)注。最明顯的標志,就是科大訊飛的市值。作為語音行業(yè)的龍頭企業(yè),短短幾年時間,科大訊飛的市值從剛上市時的34億,已經(jīng)增長到超過200億,讓人瞠目結(jié)舌。而這幾年移動互聯(lián)網(wǎng)的大規(guī)模爆發(fā),作為主要載體的智能手機在打字輸入方面非常不方便,這更讓語音識別技術(shù)變成了必需品。這大大拓展了智能語音市場的想象空間,讓人們不得不盯緊這塊巨大的蛋糕。那么,這塊巨大的蛋糕里,有多少家公司,每家公司的水平如何,讓我們來做一番梳理。

技術(shù)門檻

首先要知道,智能語音行業(yè)是個技術(shù)密集型的行業(yè),核心技術(shù)一直是智能語音行業(yè)的一個重要門檻,也是一家語音公司的核心資源。智能語音行業(yè)的技術(shù)很多,除了最著名的語音識別、語音合成外,還有說話人識別、音樂識別、語種識別等。如同“數(shù)學是科學的皇冠”一樣,語音行業(yè)技術(shù)也有一個“皇冠”,那就是“語音識別”。為什么語音識別是“皇冠”?兩點理由:一是技術(shù)上最難,二是實用前景最大。所以要考察一家語音公司的技術(shù)水平如何,就看它是否能提供高性能的語音識別產(chǎn)品??拼笥嶏w一直說自己的行業(yè)門檻高,主要就是指語音識別技術(shù)的門檻高。

前幾年語音行業(yè)不景氣,做語音的多是以學術(shù)界為主,這使得國內(nèi)的語音核心技術(shù)一直掌握在科大訊飛、中科院聲學所、中科院自動化所、清華大學等幾家單位里。同時也導致語音行業(yè)的人才很稀缺?;ヂ?lián)網(wǎng)大佬們有錢都招不到人。

除了國內(nèi)的幾家單位,還有一些著名外企在國內(nèi)設(shè)了語音研究機構(gòu),水平也很高。比如鼎鼎大名的微軟亞洲研究院,給SIRI提供語音技術(shù)的Nuance,還有IBM、摩托羅拉。不過這幾家外企的語音部門并沒有隨著國內(nèi)語音產(chǎn)業(yè)的爆發(fā)而發(fā)展。微軟亞洲研究院的語音組一直在縮水;Nuance在中國的部門一直不是核心部門;IBM的相關(guān)部門賣給了Nuance;摩托羅拉更別提了,是其中最慘的一個,語音部門解散,語音合成的部分賣給了Nuance。除了語音產(chǎn)業(yè)在前些年一直做不大的原因以外,筆者猜測的一個原因是,語音識別牽涉到信息搜集,有國家安全的考慮,所以國家不會把這部分業(yè)務(wù)放給外企來做,外企也就不再在國內(nèi)加大投入。比如Google的語音識別服務(wù),國內(nèi)的連接一直就時斷時續(xù)。

算起來,現(xiàn)在語音行業(yè)的核心帶頭人,或多或少都和上述幾家公司和單位有著聯(lián)系,要么從這幾家單位獲得學位畢業(yè),要么加入過這幾家公司。

盛大往事

談到國內(nèi)語音產(chǎn)業(yè)的發(fā)展,不能不提的就是盛大語音院。因為它確實是從無到有,花了三年時間,突破了語音產(chǎn)業(yè)的技術(shù)“護城河”。它所花費的人力成本、時間成本,無疑給各個互聯(lián)網(wǎng)大佬們做了個樣板。大佬們可以從盛大語音創(chuàng)新院的花費中,推算出如果自己想從頭開始投資語音技術(shù),需要花多少人、多少時間、多少資金,才可以在語音市場上有一席之地。這幾個重要指標下面都會細致的談一談。

盛大2009年開始成立的語音院,是金融危機爆發(fā)的后一年,也剛好是國內(nèi)語音產(chǎn)業(yè)爆發(fā)的前一年。上文說過,語音行業(yè)的人才緊缺。也就是這個時候,才能從各大語音公司和部門,挖過來那么多核心員工。據(jù)了解,盛大組建的語音團隊,從事語音技術(shù)研發(fā)的核心員工,最多的時候有三十多人。這對于語音研發(fā)團隊來說,是個相當恐怖的數(shù)字。因為通常一家公司的核心語音成員都在十人以下。而國內(nèi)做語音的也就那幾家公司。盛大基本上挖了個遍。所知道的,科大訊飛、中科院聲學所、Nuance、摩托羅拉、微軟亞洲研究院都有核心員工被挖到盛大。這些員工帶著原來公司的核心技術(shù)來到盛大,自然也要盡快拿出成果。帶著這幾家大公司的核心技術(shù),在三四十員工的研發(fā)下,盛大還是花了兩三年時間,才拿出了像樣的語音產(chǎn)品。不得不說,語音行業(yè)的技術(shù)門檻確實很高。盛大也是機緣巧合,才能突破語音技術(shù)“護城河”。

所以,從盛大的經(jīng)驗來看,要從頭開始做語音技術(shù),人數(shù)上要有三十多人。而且這一過程至少需要兩年的時間,如果考慮到團隊組建,可能會更長。資金方面,據(jù)悉,盛大對語音院的投入達到了四千多萬,人力成本的開銷的比重較大。由于這兩年各大公司都開始成立語音部門,需求的增長也讓語音人才的薪資水漲船高。所以,四千萬的資金投入還不一定能滿足這樣的成本開銷。

不過,盛大在語音行業(yè)走了步好棋,甚至市場上有聲音稱其有望挑戰(zhàn)科大訊飛。但不幸的是,整個盛大集團近期一直處于衰退階段。因為退市而資金不足的盛大,只能大幅度減少投資力度。盛大語音院的上級機構(gòu)——盛大創(chuàng)新院幾乎全部解散,讓人唏噓不已。在這場動蕩中,一部分員工離開了盛大語音院,成立了一家叫“云知聲”的公司。云知聲大約有90%的員工曾就職于盛大。短短幾個月內(nèi),這家公司就推出了自己的語音識別技術(shù)。

盛大在語音方面的投入也不是完全沒有結(jié)果。2013年,盛大語音院從盛大正式獨立,成立了一家叫“靈聲科技”的公司。據(jù)靈聲科技方面稱,盛大沒有得到靈聲科技的控股權(quán),以盛大以往在資本運作上的強勢風格來看,不知中間又發(fā)生了什么故事。

盛大栽下了“語音院”這棵樹,結(jié)了兩顆果子,一顆是“靈聲科技”,一顆是“云知聲”。從此,盛大語音院的故事告一段落,兩個新的公司帶著盛大的核心技術(shù),開始了各自的征程。

互聯(lián)網(wǎng)大佬的現(xiàn)狀

既然盛大投資了語音產(chǎn)業(yè),其他幾家互聯(lián)網(wǎng)巨頭也想從該領(lǐng)域分一杯羹。騰訊、百度、阿里、搜狗陸續(xù)成立了語音部門。

對百度和搜狗這類搜索公司,語音識別技術(shù)是必須的,而且其商業(yè)價值也很清晰,因為Google已經(jīng)驗證了語音搜索在移動終端的重要性,國內(nèi)搜索公司只需要跟進投入即可。因此,百度方面由李彥宏親自督管該項目。騰訊方面,其語音部門隸屬于微信事業(yè)部,微信大批量的語音輸入,使得語音識別的用處很廣泛。阿里則是剛開始介入語音產(chǎn)業(yè),部門也才成立不久。

這幾家公司里,百度的語音技術(shù)已經(jīng)做的不錯。2010年就成立了語音部門的百度,開始都是游兵散勇。百度還從中科院聲學所買了一些授權(quán),但是沒有專業(yè)的語音開發(fā)人員,沒做出什么成果。正如之前所說,語音技術(shù)門檻高,從頭開始做很難,沒有其他公司的技術(shù)積累基本無望。百度后來從中科院自動化所挖來一批人才,通過自動化所的技術(shù)累積,花了兩年多的時間,才慢慢地把語音技術(shù)做了起來。騰訊其實也差不多從2010年左右開始投入語音技術(shù),但是力度一直比較分散。據(jù)說當時騰訊研究院、輸入法等兩三個地方都在做語音,每個團隊都是一兩個人,所以一直沒見成果。近期由于微信大紅,其中有大量的語音輸入,因此才將語音研發(fā)人員整合起來,步入正軌,不過要達到其它家的水平,尚需時日。其他幾家公司中,搜狗對語音技術(shù)已投入了一年多,目前為止還是相當一般,否則搜狗語音助手也不會還依賴于第三方的語音引擎了。阿里的部門今年才成立,更不用說技術(shù)了。

國內(nèi)那些專業(yè)語音公司

除了上文提到的語音公司的龍頭企業(yè)——科大訊飛,出身于盛大的云知聲和靈聲科技外,其實在近些年里,國內(nèi)成立的其他語音公司也有若干家。捷通華聲就是一個出身于科研院所的典型。這家語音公司一開始技術(shù)上是依托于中科院的聲學所,成立時間基本和訊飛相當。在之前相當長一段時間內(nèi),也是和訊飛旗鼓相當。但是最終的結(jié)果是訊飛發(fā)展起來并成功上市,而它則相對慘淡。近年來捷通華聲語音技術(shù)上并沒有太大的起色,而市場應(yīng)用也還是那一畝三分地,比如一些科研項目。與之類似的,另外一家依托于聲學所的語音公司——中科信利,其發(fā)展狀況也差不多。

除了聲學所以外,中科院的自動化所也是國內(nèi)語音技術(shù)的一股中堅力量,從中也分出了幾家語音類的公司,其中包括紫冬銳意和納象立方。紫東銳意以語音和翻譯為核心技術(shù),主要提供口語翻譯軟件。納象立方則主要對視頻進行字幕處理。

除此之外,近期也出現(xiàn)了一些海外背景的語音公司,針對于大語音產(chǎn)業(yè)的細分領(lǐng)域。一個是蘇州思必馳,據(jù)稱該公司的創(chuàng)始團隊成員有劍橋大學的背景,主要是將語音技術(shù)應(yīng)用于英語教育。還有一個是普強信息,該公司的創(chuàng)始團隊來自硅谷,其主要業(yè)務(wù)是為呼叫中心提供智能語音技術(shù)。

跨越技術(shù)“護城河”的標志

此前說了這么多技術(shù)門檻,大家可能會有疑問,如何判斷一家公司的語音技術(shù)已經(jīng)越過了“護城河”。不能是你說行就行,你說不行就不行,要有一個客觀標準。這個客觀標準是什么?業(yè)界的討論是,是否推出了語音識別公開平臺。為什么這么說?如之前所述,語音識別技術(shù)是語音產(chǎn)業(yè)的“皇冠”。那么判斷一個公司的核心技術(shù)水平,就看它的語音識別技術(shù)做的怎樣。而通過語音識別公開平臺,就可以判斷一家公司的語音識別技術(shù)水平。從這點上看,科大訊飛是最早公開發(fā)布的,也肯定了科大訊飛的技術(shù)水平。盛大語音院是第二家發(fā)布的,現(xiàn)變更為靈聲科技繼續(xù)開發(fā)。搜狗公司曾使用過盛大的語音識別平臺,也算確認其技術(shù)水平。云知聲推出稍晚,但是近期宣傳非常高調(diào)。其它語音公司包括捷通華聲、紫冬語音甚至普強信息也各自都發(fā)布自己的語音技術(shù)平臺,但是在市場上并沒有看到太多應(yīng)用的聲音。百度雖然沒有對外發(fā)布,但是在百度內(nèi)部,已經(jīng)推出了一個語音識別平臺。這幾家可以算得上圈子內(nèi)正式的玩家。

發(fā)展前景

我們把國內(nèi)現(xiàn)有的語音公司和部門分為兩類。一類是獨立的語音公司,以訊飛、云知聲、靈聲科技為代表;一類是互聯(lián)網(wǎng)巨頭公司的語音部門,以百度、騰訊、搜狗為代表。

獨立的語音公司策略比較靈活,可以多方面發(fā)展,但平臺的可能性不夠大。但訊飛比較例外,即作為獨立的語音公司,同時去年又和中國移動達成戰(zhàn)略合作,解決了發(fā)展平臺的問題。這也是它被投資者看好的原因。出身于盛大的靈聲科技、云知聲,雖然語音技術(shù)上已經(jīng)可以和訊飛相媲美,但發(fā)展平臺與訊飛差距很大,商務(wù)上也不及訊飛這么多年的積累,需要傍大樹,才能獲得迅速的發(fā)展。但技術(shù)門檻已經(jīng)被突破,所以訊飛也在這幾家新公司而頭疼。

互聯(lián)網(wǎng)巨頭公司的語音部門有個大的發(fā)展平臺,但是基本上只服務(wù)于公司的整體戰(zhàn)略,很難在多方面發(fā)展。比如百度的語音部門,就服務(wù)于百度的語音搜索業(yè)務(wù)和語音助手業(yè)務(wù)。騰訊的語音部門,就服務(wù)于微信業(yè)務(wù)。這些部門今后的命運,可能類似于微軟公司的語音部門、谷歌公司的語音部門,專門為本公司的核心戰(zhàn)略服務(wù)。

隨著去年SIRI的推出,語音號稱作為移動互聯(lián)網(wǎng)的入口,想象空間高到爆棚,讓所有人都心動了一把。但經(jīng)過這段時間的發(fā)展來看,還為時過早。整個語音產(chǎn)業(yè)的后續(xù)發(fā)展趨勢,還值得繼續(xù)觀察。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉