當(dāng)前位置:首頁(yè) > 智能硬件 > 智能硬件
[導(dǎo)讀] 有兩條關(guān)于百度的消息很有意思:一條是收購(gòu)渡鴉團(tuán)隊(duì),一條是把度秘團(tuán)隊(duì)升級(jí)為度秘事業(yè)部,兩邊都向陸奇匯報(bào)工作。這種軟硬融合的戰(zhàn)略選擇是極其正確的。

 有兩條關(guān)于百度的消息很有意思:一條是收購(gòu)渡鴉團(tuán)隊(duì),一條是把度秘團(tuán)隊(duì)升級(jí)為度秘事業(yè)部,兩邊都向陸奇匯報(bào)工作。這種軟硬融合的戰(zhàn)略選擇是極其正確的。

這并不是馬后炮,我在2016年10月發(fā)的《雖然很投入,但李彥宏可能正在錯(cuò)過人工智能》里核心觀點(diǎn)之一就是:百度是國(guó)內(nèi)對(duì)人工智能投入力度最大的公司,但其不碰硬件的戰(zhàn)略很可能導(dǎo)致它最終錯(cuò)過人工智能里對(duì)它最關(guān)鍵的部分。雖然大方向正確,但如果互聯(lián)網(wǎng)公司真想學(xué)亞馬遜,就還差了那么一點(diǎn)東西。

 


 

語音賽道的AI到底需要解決什么問題

國(guó)內(nèi)絕不缺和Echo類似的產(chǎn)品,但此前的命運(yùn)都是折戟沉沙,這里的關(guān)鍵在于對(duì)什么是這類產(chǎn)品上要解決的核心問題認(rèn)知不清。自由交流,喚醒詞,速度,方言,內(nèi)容,習(xí)慣等每個(gè)似乎都可以成為要解決的核心問題,但實(shí)際上所有這個(gè)賽道上玩家最核心的問題是:在語義、方言這些剛性約束不突破的條件下打造出速度、精度、內(nèi)容相匹配的產(chǎn)品。

智能語音也就是說要解決的并非寬適配問題,而是要在面對(duì)主流人群真在技術(shù)上下功夫,把體驗(yàn)做好。語音交互上糊弄的空間極小,兩句話就能感受出體驗(yàn)咋樣。這里面最受關(guān)注的是語義的問題,因?yàn)槿藗兛偸窍蛲杂傻慕涣鳎Z義肯定是交互的一個(gè)瓶頸,但我們可以把語音交互根據(jù)語義的技術(shù)進(jìn)展分解為兩個(gè)階段:

第一階段是語義并沒有核心突破,也就是說最理想狀態(tài)也就達(dá)到75分。這時(shí)候打造產(chǎn)品的根本出發(fā)點(diǎn)是不指望自由語言交流,而讓語音交互偏命令控制,但也打造出極為優(yōu)秀的用戶體驗(yàn)。Echo大的定位就是這樣一種產(chǎn)品。這時(shí)候產(chǎn)品的核心瓶頸是前端的聲學(xué)(麥克風(fēng)陣列+聲學(xué)算法),這是眼下的問題,不解決產(chǎn)品體驗(yàn)不可能好。基于這判斷我在2015年末開始使了很大力氣為公司尋找公司,最終這也是我2016年投資聲智科技的核心原因,當(dāng)時(shí)邏輯很簡(jiǎn)單:這個(gè)問題顯然中科院聲學(xué)所更擅長(zhǎng)解決,而聲智科技幾乎是聲學(xué)所人員所創(chuàng)辦的唯一的一家AI企業(yè)。

第二階段是語義真的取得突破,這無疑會(huì)更大的擴(kuò)展語音交互的應(yīng)用范圍,一旦這個(gè)點(diǎn)得以突破,語音交互會(huì)變的無處不在,但我們必須承認(rèn)什么時(shí)候語義能夠徹底解決仍然不確定,這是屬于未來的事情。

這種時(shí)間軸上的錯(cuò)亂是很可怕的,那樣就會(huì)在現(xiàn)有產(chǎn)品上挑戰(zhàn)不可能解決的問題,比如不用喚醒詞,指望Echo這類產(chǎn)品什么都能干等。

總結(jié)來看我們可以這樣講:如果真想做出Echo那樣的產(chǎn)品,聲學(xué)(麥克風(fēng)陣列+算法),語音識(shí)別,語義三層里面眼下的瓶頸是聲學(xué),未來的瓶頸是語義,前者影響現(xiàn)在產(chǎn)品賣不賣的出去,后者影響適用范圍的大小。但即使只是前者這也是一個(gè)足以對(duì)標(biāo)Pad的新品類。

差的那么一點(diǎn)點(diǎn)

真走軟硬融合的道路,顯然的關(guān)鍵要素是:良好的產(chǎn)品定義,足夠成熟的技術(shù)要素,系統(tǒng)整合產(chǎn)品的能力(其實(shí)還有通暢的銷售渠道)。系統(tǒng)整合一項(xiàng)要求一個(gè)公司整合軟硬團(tuán)隊(duì),否則不同利益訴求會(huì)導(dǎo)致軟硬團(tuán)隊(duì)很難高度配合,而在產(chǎn)業(yè)初期,不同層次間接口標(biāo)準(zhǔn)化很差,容易導(dǎo)致產(chǎn)品夭折。產(chǎn)品定義則高度依賴于個(gè)人,就看當(dāng)事人的能力,對(duì)公司而言需要一點(diǎn)運(yùn)氣。

這樣一來唯一欠缺的是足夠成熟的技術(shù)要素。這是非常麻煩的一點(diǎn),對(duì)于互聯(lián)網(wǎng)公司尤其艱難,因?yàn)檎嫱@條路上走欠缺的并非是計(jì)算機(jī)算法上的認(rèn)識(shí),也還牽扯物理,這對(duì)于互聯(lián)網(wǎng)公司是個(gè)大大的盲點(diǎn)。

從這個(gè)視角正好可以理解蘋果和Google的差別,蘋果是要高度關(guān)注物理層面的東西的,比如材料、電池、屏幕、傳感器等,Google顯然會(huì)更關(guān)注算法。所以蘋果的云端技術(shù)始終不好,而Google做產(chǎn)品就也總是一般。喬布斯萬眾矚目所以大家看到的是他的偏執(zhí)、癲狂乃至藝術(shù)氣息,但實(shí)際上他背后是有一坨人在幫他解決物理上的麻煩事的,現(xiàn)在的庫(kù)克就是其中之一。

這并不只是百度一個(gè)公司的問題,而是新時(shí)代趨勢(shì)對(duì)互聯(lián)網(wǎng)公司的一種系統(tǒng)型挑戰(zhàn)。我在之前的文章中曾經(jīng)提到過,一個(gè)行業(yè)的興起事實(shí)上是三個(gè)大的階段:

第一階段是Enabling技術(shù)的成熟,類比的話就是手機(jī)上的高通和MTK,在語音產(chǎn)業(yè)鏈上聲智科技扮演類似的角色。

第二階段是硬件產(chǎn)品的成熟,類比的話就是Apple II或者iPhone 1代,在語音產(chǎn)業(yè)鏈上就是Echo。需要注意Echo是起點(diǎn)而不是終點(diǎn),是剛跨過可用線的一款產(chǎn)品。

第三階段才是新硬件平臺(tái)上軟件應(yīng)用的成熟,比如PC上就是Office,手機(jī)上就是微信。在語音產(chǎn)業(yè)鏈上這點(diǎn)還沒展開。

互聯(lián)網(wǎng)縮短了第一階段和第二階段間的過渡過程,相當(dāng)于兩者在同步發(fā)生,也正因此才需要軟硬融合。但互聯(lián)網(wǎng)公司獨(dú)自解決第一個(gè)問題能力會(huì)偏弱,這就是欠缺的那一點(diǎn)點(diǎn)。

硝煙會(huì)從今日起

也許是為了提振股價(jià),百度十分高調(diào)的公布了這件事情。這也很有意思,因?yàn)榘俣冗@樣做很可能會(huì)引起連鎖反應(yīng)。在這之前,大家基本都處于觀望狀態(tài),當(dāng)其中一個(gè)真的下注后,別的人就會(huì)開始系統(tǒng)考慮這件事情別人做成了對(duì)我會(huì)有什么樣的影響。

這事一旦開始推敲,騰訊、阿里就會(huì)認(rèn)識(shí)到這是自己輸不起的戰(zhàn)爭(zhēng)。這點(diǎn)我在之前的文章里提到過,但很有必要在百度采取行動(dòng)的時(shí)候再次重述:

我們先做個(gè)基本的假設(shè),那就是Alexa獲得了巨大成功(Echo、智能音箱、Alexa有關(guān)聯(lián),但其實(shí)是不同的東西,這點(diǎn)在之前文章中有說,這里不再重復(fù)),滲透到各種設(shè)備之中,包圍了人們的生活,人們有50%的時(shí)間在通過語音和設(shè)備打交道,并且日活逼近Android。

那這時(shí)候一定會(huì)衍生這樣的需求,用戶會(huì)說:Alexa,幫我通知下馬化騰,明天我不見他了。這時(shí)候就需要有一種通訊的IM來實(shí)現(xiàn)這種需求。這時(shí)候亞馬遜就有兩個(gè)選擇:第一它接入一種已有IM,比如Whatsapp,或者Skype。第二種是自己做一個(gè)嵌在Alexa里面。亞馬遜至少有一半的幾率會(huì)選擇后者,而不是把這種基礎(chǔ)設(shè)施開放給別人,因?yàn)榍皟煞N要么屬于Facebook,要么屬于微軟。如果在中國(guó)是阿里巴巴做成了Alexa,那估計(jì)百分百不會(huì)選擇對(duì)接微信。

這樣一來配合一個(gè)語音交互的核心特征,顛覆性的事情就出現(xiàn)了:語音交互背后隱藏的各種應(yīng)用具有唯一性。

我們很難想象這種語音交互方式:Alexa幫我用Whatsapp給馬化騰留個(gè)消息,明天我不見他了。在語音交互中WhatsApp這類應(yīng)用的標(biāo)識(shí)很可能會(huì)被優(yōu)化掉。如果Alexa還只是百萬級(jí)、千萬級(jí)DAU的應(yīng)用時(shí)那這個(gè)特性還不關(guān)鍵,但如果它是10億DAU的系統(tǒng),那這個(gè)特性的影響就會(huì)被無限放大,也就說搜索、IM、電商很可能都只有一家,而不是像現(xiàn)在雖然少,但還有個(gè)1,2,3名。

小結(jié)

今天幾乎已經(jīng)沒人再懷疑語音交互的成立了,有意思的事情是這種變化只發(fā)生在過去不到半年的時(shí)間里?,F(xiàn)在看2017年的熱鬧很可能在這里發(fā)生,這是件牽連極廣的事情:它會(huì)牽涉人工智能(聲學(xué)、語音語義公司),它會(huì)升級(jí)智能硬件公司,原本的智能硬件其實(shí)已經(jīng)被鄙視了,但Echo顯然不是什么萬物互聯(lián)賽道而是人工智能賽道。好吧,想做的要盡快進(jìn)來,不想做這個(gè)行業(yè)的,可以搬個(gè)板凳看熱鬧了。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉