語(yǔ)音識(shí)別領(lǐng)域芯片公司該如何定位?
報(bào)道蘋(píng)果公司時(shí)記者總是這樣類比:世界銀行追蹤研究的199個(gè)國(guó)家中,有183個(gè)國(guó)家的2015年國(guó)內(nèi)生產(chǎn)總值(GDP)低于蘋(píng)果市值。蘋(píng)果市值幾乎是伊朗和奧地利GDP的總和。從這個(gè)角度看,蘋(píng)果、谷歌、亞馬遜這樣的巨無(wú)霸之間的競(jìng)爭(zhēng)很像一場(chǎng)國(guó)戰(zhàn)。國(guó)戰(zhàn)的根本特征是不管你喜歡不喜歡最終都會(huì)被卷入,那怕你與此看似毫不相關(guān),恰如互聯(lián)網(wǎng)與傳統(tǒng)零售行業(yè)。
終極生態(tài)與即將白熱化的競(jìng)爭(zhēng)
到現(xiàn)在為止我們?cè)贗T行業(yè)看到了三類性質(zhì)迥異的成功:
一類是硬科技型公司,比如Intel和高通,這類硬科技項(xiàng)目雖然其上也有生態(tài),但技術(shù)壁壘仍然在商業(yè)模式中占據(jù)較大權(quán)重;
一類是工具平臺(tái)型公司,在這點(diǎn)上集大成的是操作系統(tǒng),典型公司則是微軟。對(duì)于操作系統(tǒng)而言技術(shù)、工程等很關(guān)鍵,但更關(guān)鍵的則是其上的應(yīng)用生態(tài)系。所以雖然Linux免費(fèi),但也沒(méi)可能在PC這種終端上撼動(dòng)微軟的地位。
一類是互聯(lián)網(wǎng)生態(tài)公司,這點(diǎn)大家會(huì)比較熟悉,比如我們常說(shuō)的BAT。和上一類的核心差異在于Windows根本不是數(shù)據(jù)驅(qū)動(dòng),而互聯(lián)網(wǎng)生態(tài)公司大多時(shí)候其生態(tài)依賴于其里面的數(shù)據(jù)和內(nèi)容。社交時(shí)關(guān)系鏈?zhǔn)瞧浜诵膬?nèi)容,搜索時(shí)爬到的東西是其內(nèi)容,電商時(shí)商品是其內(nèi)容。
這種行業(yè)分工內(nèi)置了足夠的技術(shù)合理性,不太會(huì)發(fā)生實(shí)質(zhì)性變化。但可能會(huì)變化的是公司在其中扮演的角色,比如Google最終同時(shí)控制操作系統(tǒng)和搜索引擎,這會(huì)影響最終競(jìng)爭(zhēng)的走勢(shì)。在最終格局中實(shí)際扮演那種角色影響控制權(quán),而控制權(quán)影響商業(yè)模式和利潤(rùn)空間。
以控制力大小而論,中間層非數(shù)據(jù)驅(qū)動(dòng)的OS影響力最大,其次才是互聯(lián)網(wǎng)生態(tài)公司,最弱是硬科技型公司。這在近來(lái)蘋(píng)果PK騰訊一事中體現(xiàn)的特別清楚。因此我們也可以說(shuō)直到Android,Google的商業(yè)模式其實(shí)并不穩(wěn)固,所以它才那么有動(dòng)力在OS層突圍。
這樣一來(lái)國(guó)戰(zhàn)的焦點(diǎn)就在于誰(shuí)能控制遠(yuǎn)場(chǎng)語(yǔ)音交互下的OS。這點(diǎn)上結(jié)局很可能和過(guò)去不同,因?yàn)檫@些公司都實(shí)在太大了。
蘋(píng)果不用說(shuō)一定還會(huì)是自己的封閉生態(tài)系,Google,亞馬遜和微軟則一定會(huì)在各自的勢(shì)力版圖上排斥對(duì)方。短期看,Google和亞馬遜不太可能分出勝負(fù),也不太可能使用對(duì)方的系統(tǒng)。這是非常有意思的一種局面,過(guò)去在行業(yè)早期巨頭就同時(shí)關(guān)注某一行業(yè)的先例不是沒(méi)有但并不能形成相對(duì)勢(shì)均力敵的競(jìng)爭(zhēng),比如Windows+Nokia 與Android陣營(yíng)的競(jìng)爭(zhēng)。但這次在行業(yè)早期所有的巨頭都關(guān)注這個(gè)點(diǎn),每家背后都近乎擁有無(wú)盡的資源。所以戰(zhàn)況一定會(huì)比想的還要激烈。
作為結(jié)果我們可能會(huì)在較長(zhǎng)的時(shí)間內(nèi)面臨多OS并存的局面。
高通這樣的芯片公司位置在哪里每次人機(jī)交互的變革必會(huì)引起OS的變革,這至少在過(guò)去兩次產(chǎn)品大升級(jí)中得到了驗(yàn)證。從命令行到圖形用戶界面促成了Windows這樣的操作系統(tǒng),而從鍵盤(pán)鼠標(biāo)到觸屏則促成了iOS和Android。所以我們有理由相信這次遠(yuǎn)場(chǎng)語(yǔ)音交互一樣會(huì)引起OS層面的變更。在這背景下看高通這類芯片公司的角色和行為就特別有意思。
高通最近推出了一款SoC,讓IPQ40x8/9支持陣列算法,從各方報(bào)道來(lái)看應(yīng)該是通過(guò)DSP來(lái)實(shí)現(xiàn)的。高級(jí)副總裁Rahul Patel則說(shuō):有可能Echo的語(yǔ)音功能都會(huì)被整合進(jìn)AP,這是新的趨勢(shì)。這樣一來(lái)有些傳統(tǒng)廠商比如科勝訊確實(shí)會(huì)難過(guò),因?yàn)檫^(guò)去一般是它們搭著高通等來(lái)實(shí)現(xiàn)一組功能,這下高通把事情全干了,相當(dāng)于它們不太好找到自己的位置了。
但高通干的事其實(shí)并不對(duì)路,放在整個(gè)人機(jī)交互變革的背景下看就相當(dāng)于需要回答:OS適合放到芯片里面嗎?
OS顯然不能放芯片里,算法是可以放芯片里的,但算法是遠(yuǎn)場(chǎng)語(yǔ)音交互的一個(gè)部分,并且不太適合切割出來(lái)。
這可以拿喚醒做例子進(jìn)行說(shuō)明,實(shí)現(xiàn)喚醒的時(shí)候通常需要與最終產(chǎn)品的亮燈相關(guān)聯(lián)。這樣一來(lái)首先要有降噪算法提高喚醒率,然后訓(xùn)練過(guò)的喚醒模型監(jiān)測(cè)周圍的聲音,一旦檢測(cè)到喚醒詞時(shí),要反饋出特定的角度,這個(gè)角度信息再傳遞給系統(tǒng),系統(tǒng)才知道Echo上面那一圈燈究竟應(yīng)該亮那個(gè)。顯然的在這個(gè)場(chǎng)景下,算法、消息、硬件控制彼此交織在一起,這是OS的范疇,但并不是芯片的范疇。
一般來(lái)講這類彼此間的消息越多,OS對(duì)外呈現(xiàn)出的功能也就越強(qiáng)大。這樣的一種系統(tǒng)顯然不可能放芯片里。唯有部分算法是可以放芯片里的,但在行業(yè)早期這樣其實(shí)并沒(méi)太大價(jià)值,一是算法并未穩(wěn)定仍然需要持續(xù)提高,一是這種芯片集成算法的方式反倒會(huì)降低整個(gè)系統(tǒng)的靈活程度。假設(shè)A公司想做一款叫X的產(chǎn)品,其未來(lái)衍生產(chǎn)品為Y,那當(dāng)然它希望用統(tǒng)一架構(gòu)實(shí)現(xiàn)這兩者,而A公司顯然也不希望這種實(shí)現(xiàn)只能用高通的某幾款芯片,而希望在更寬的范圍內(nèi)進(jìn)行靈活選擇。
微信上很多人看到高通干這事會(huì)很震驚等等,覺(jué)得會(huì)對(duì)行業(yè)產(chǎn)生如何如何的影響,但實(shí)際上并沒(méi)有意識(shí)到高通其實(shí)選了條歪路。高通在語(yǔ)音交互這事上應(yīng)該是一直沒(méi)太想清楚,它并不是第一次干與語(yǔ)音交互相關(guān)的事(JAN 6, 2016就做過(guò)類似的發(fā)布),但似乎每次最終都會(huì)無(wú)疾而終。
這樣一來(lái)芯片公司的角色就非常清楚:芯片公司在遠(yuǎn)場(chǎng)語(yǔ)音交互這場(chǎng)PK中會(huì)是受益者,但顯然不能發(fā)揮主導(dǎo)作用。這與PC或手機(jī)剛啟動(dòng)的時(shí)候狀態(tài)非常不一樣。那個(gè)時(shí)候如果沒(méi)有Intel、高通一代代賦能,PC或手機(jī)這樣的產(chǎn)品是沒(méi)辦法一代代升級(jí)的。也就是說(shuō)芯片公司是在關(guān)鍵路徑上。但眼下已有各種芯片其計(jì)算能力是足夠的,而交互方式本身與操作系統(tǒng)融合更緊。
高通與蘋(píng)果會(huì)給遠(yuǎn)場(chǎng)語(yǔ)音交互帶來(lái)什么雖然蘋(píng)果的產(chǎn)品不一定立刻就大賣,高通的SoC估計(jì)也掀不起什么浪花,但他們確實(shí)會(huì)為這個(gè)賽道注入更多的信心。
就像觸屏影響了所有的設(shè)備一樣,遠(yuǎn)場(chǎng)語(yǔ)音交互也一定會(huì)影響所有設(shè)備。這就為市場(chǎng)提供了足夠多的新機(jī)會(huì)。
在巨頭的帶動(dòng)下,已有產(chǎn)品品類會(huì)普遍進(jìn)行升級(jí),汽車、手機(jī)、PAD、筆記本、電視、玩具、攝像頭、耳機(jī)等。而新的產(chǎn)品品類也會(huì)持續(xù)出現(xiàn),比如訊飛經(jīng)常展示的翻譯機(jī)、電話會(huì)議系統(tǒng)等。
產(chǎn)品大升級(jí)的同時(shí)也會(huì)催生方案提供商上的需求。聲音的冷僻程度要遠(yuǎn)比當(dāng)年做手機(jī)時(shí)的系統(tǒng)定制為甚,復(fù)雜程度也會(huì)遠(yuǎn)超此前的手機(jī)。在有的場(chǎng)景它可能對(duì)功耗提出極高的要求,在有的場(chǎng)景,它可能更多的是挑戰(zhàn)性價(jià)比。這點(diǎn)通過(guò)了解聲智科技推出的各種方案可以獲得更為直觀的體驗(yàn)。不再一線的人很難理解這種復(fù)雜度是如何導(dǎo)入的,因?yàn)槔碚撋纤坪跸窀咄菢影阉惴ㄅc芯片相結(jié)合,所有的問(wèn)題就應(yīng)該解決了。但實(shí)際上這樣是不行的,因?yàn)閺乃惴ê托酒骄唧w能落地的產(chǎn)品中間還有著很大的距離:麥克風(fēng)數(shù)產(chǎn)生距離、陣型產(chǎn)生距離、計(jì)算結(jié)構(gòu)也產(chǎn)生距離、新需求的持續(xù)發(fā)生等也會(huì)導(dǎo)入類似的問(wèn)題。
但這個(gè)層次確實(shí)具有高度不確定性,是會(huì)出現(xiàn)MTK那種提供Turnkey方案的公司,還是會(huì)出現(xiàn)新的OS,或者OS會(huì)有什么新的變種,亦或者會(huì)長(zhǎng)期多OS并存?
小結(jié)
短期來(lái)看高通、蘋(píng)果的入局實(shí)質(zhì)影響不大,更多的是在信心層面。兩個(gè)顯然的后果里:一個(gè)是高度確定的,那就是遠(yuǎn)場(chǎng)語(yǔ)音交互必成;一個(gè)則具有高度不確定性,傳統(tǒng)的OS一層上到底會(huì)發(fā)生什么?