告別高光時(shí)刻的500 天 搜狗“分身”
2019 年兩會(huì)期間,由「分身技術(shù)」合成的 AI 女主播「新小萌」正式上崗新華社。這款產(chǎn)品是以新華社主播屈萌為原型,不僅會(huì)用自然連貫的人聲進(jìn)行播報(bào),就連唇形、面部表情也十分逼真。
這不是搜狗 AI 主播第一次引起轟動(dòng)。2018 年的 11 月,搜狗分身技術(shù)第一次在媒體領(lǐng)域?qū)崿F(xiàn)落地—;—;以央視主持人新華社為原型的虛擬主播亮相烏鎮(zhèn)世界互聯(lián)網(wǎng)大會(huì),眨眼、挑眉、唇動(dòng)每個(gè)動(dòng)作都自然得超過了預(yù)期,引得周圍不停有人駐足、拍照、詢問。
分身技術(shù),這種基于多種模態(tài)識(shí)別融合的技術(shù),包括語音、手寫、唇語等維度的識(shí)別和模擬,能通過數(shù)個(gè)小時(shí)的視頻資料就能合成一個(gè)比較逼真的真人形象。
這是搜狗上市后,在其 AI 故事框架活躍著的最新主角們。
有人質(zhì)疑繼語音筆后,搜狗又在自己的 AI 戰(zhàn)略中搞了新的「噱頭」。500 天以來,搜狗在人工智能方面取得的成績(jī)?cè)谕馊丝磥韰s有些火候欠佳。翻譯筆、虛擬主播以及在 3 月 18 日最新發(fā)布的錄音筆,這些看起來互不關(guān)聯(lián)的落地產(chǎn)品構(gòu)成了搜狗 AI 戰(zhàn)略的前行的一個(gè)個(gè)腳印。
但搜狗的 AI 技術(shù)落地產(chǎn)品真的是噱頭嗎?如何理解搜狗這些看似毫無關(guān)聯(lián)的產(chǎn)品?這些產(chǎn)品背后又體現(xiàn)了王小川哪些思考?為了解答這些疑問,我們?cè)跇O客公園 IF 大會(huì)后和王小川聊了聊,也走進(jìn)搜狗內(nèi)部與搜狗語音交互技術(shù)中心高級(jí)總監(jiān),同時(shí)也是新華社 AI 主播項(xiàng)目的負(fù)責(zé)人陳偉進(jìn)行了交流。試圖理清搜狗正在真正講著的故事。
一個(gè)個(gè)頓號(hào)
自今近 500 天前,2017 年 11 月 9 日是屬于搜狗的高光時(shí)刻。在上市緘默期結(jié)束的六個(gè)小時(shí)之后,王小川第一次提出了公司未來的 AI 戰(zhàn)略—;—;以語言為核心。其中包括兩個(gè)部分:第一部分是人機(jī)交互,包括感知和認(rèn)知層面對(duì)語言的理解,以及語音合成;第二部分以語言為核心,圍繞機(jī)器閱讀理解和推理能力,稱為知識(shí)計(jì)算。
這恰好是能完整地扣回到分身上的理念。據(jù)陳偉介紹,在形成基于從識(shí)別到理解、認(rèn)知,再到表達(dá)整個(gè)閉環(huán)過程中,團(tuán)隊(duì)里有兩條不同的大線,一條線在做語音交互,怎么能夠讓人機(jī)交互更自然;另一條做語音翻譯,語音同傳的能力。翻譯筆亦是如此,緊緊圍繞著公司 AI 戰(zhàn)略的核心。
熟知王小川的好友對(duì)極客公園說:「分身、智能硬件只是一個(gè)大方向上的子集,一種階段性成熟技術(shù)的應(yīng)用。不是終點(diǎn),也不是下一個(gè)業(yè)務(wù),甚至不是逗號(hào),是一個(gè)頓號(hào)?!箤?duì)于搜狗而言,逗號(hào)意味著以特定產(chǎn)品作為階段性目標(biāo),而頓號(hào)只是一個(gè)個(gè)嘗試。在真正尋找下一個(gè)增長點(diǎn)時(shí),搜狗還需要更多頓號(hào)去實(shí)驗(yàn)和實(shí)踐。
他相信搜狗目前的這些看似分散的產(chǎn)品,最終拼湊成一張抵達(dá)王小川關(guān)于智能世界終極設(shè)想的藍(lán)圖:用 AI 解決跨語言隔閡問題,優(yōu)化人類溝通效率,「你可能現(xiàn)在并不能發(fā)現(xiàn)這一個(gè)個(gè)產(chǎn)品的關(guān)聯(lián),但是就像拼圖一樣,其實(shí)是在一個(gè)統(tǒng)一設(shè)想下進(jìn)行的。」
這些產(chǎn)品不僅是圍繞著大方向演進(jìn),而且還有自身的商業(yè)價(jià)值。陳偉說,目前的 AI 分身項(xiàng)目已經(jīng)具備快速穩(wěn)定落地的能力,從語音識(shí)別到合成、唇語識(shí)別,到圖像方面的表情生成、肢體生成等,團(tuán)隊(duì)已經(jīng)建立一套完整的流水線工作體系。未來除了在新聞主播領(lǐng)域之外,分身技術(shù)或?qū)⒃诳头?、教育、娛樂等?chǎng)景落地,「商務(wù)的事情是商務(wù)團(tuán)隊(duì)正在談?!?/p>
智能硬件變現(xiàn)能力早已受到肯定。署名為 Himalayas Research 的科技股和全球消費(fèi)買方分析師認(rèn)為對(duì)搜狗的正確考量應(yīng)該是:「投資者應(yīng)該繼續(xù)關(guān)注廣告收入的趨勢(shì),以及該公司的其他業(yè)務(wù)組成(微信搜索變現(xiàn)和智能硬件)能否開始對(duì)收入做出貢獻(xiàn)?!?/p>
理工男的技術(shù)信仰
從財(cái)報(bào)來看,搜索成了一塊旱澇保收的「自留地」。2018 年搜狗總營收達(dá) 11.2 億美元,同比增長 24%;美國通用會(huì)計(jì)準(zhǔn)則下,歸屬于搜狗的凈利潤 9880 萬美元,同比增長 20%。其中,搜狗搜索和搜索相關(guān)營收為 10.2 億美元,較 2017 年增長 28%,僅 2018 年第四季度就達(dá) 2.77 億美元。
因此,對(duì)于外界而言,直到今天,廣告收入和流量成本仍然是考量搜狗的核心指標(biāo)。Himalayas Research 在 2019 年 2 月的分析文章寫道:管理層預(yù)計(jì),2019 年全年,以人民幣計(jì)算,行業(yè)總水平將以每年 10% 左右的速度增長,搜狗在 2019e 財(cái)年的表現(xiàn)應(yīng)該會(huì)更好,這意味著今年晚些時(shí)候的增長會(huì)加快。盡管如此,考慮到廣告空間的競(jìng)爭(zhēng)越來越激烈,而 TAC(流量獲取成本) 的增長速度超過了收入的增長速度,這并不讓人印象深刻。
用產(chǎn)品獲取用戶,再用流量換得收入。這是市面上通行的游戲規(guī)則。
在互聯(lián)網(wǎng)還處于蠻荒拓展時(shí)期,這種流量為王的思維并不過時(shí)。不論是古老一些的 QQ,還是前兩年的瘋狂補(bǔ)貼的「外賣戰(zhàn)」,再到通過聚攏還沒有被挖掘的流量,從而短期獲得快速增長的拼多多、趣頭條都印證了這一想法。
技術(shù)、產(chǎn)品、流量,這三者中受重視的是后兩者,技術(shù)是退居幕后的角色。但王小川卻試圖打破這一默認(rèn)規(guī)則,把技術(shù)作為搜狗的本質(zhì)?!竿跣〈ㄟ€是希望搜狗能堅(jiān)持技術(shù)公司的本質(zhì),考慮到資本市場(chǎng)、股價(jià)等,很多人認(rèn)為抓住流量變現(xiàn)是現(xiàn)在搜狗需要做。如果按照這樣的方式去考量搜狗的產(chǎn)品策略,就很難真正理解他的想法?!?/p>
在技術(shù)探索上,搜狗很慷慨。2019 年 2 月 1 日,搜狗公布了截至 2018 年 12 月 31 日全年未經(jīng)審計(jì)的財(cái)務(wù)報(bào)告。其中顯示,2018 年研發(fā)支出為 2.017 億美元,較 2017 年增長 17%,占總營收費(fèi)用的 17.9%。而該項(xiàng)支出除了用于核心業(yè)務(wù)技術(shù)升級(jí)外,還用于探索分身技術(shù)、智能硬件等最新的商業(yè)應(yīng)用場(chǎng)景探索。
不過,在將技術(shù)作為攻克跨時(shí)代困擾的手術(shù)刀時(shí),王小川也很清楚的認(rèn)識(shí)到,搜索業(yè)務(wù)在搜狗內(nèi)部仍然是重要的驅(qū)動(dòng)引擎。他曾在接受媒體采訪時(shí)表示,2018 年搜狗的核心戰(zhàn)略是通過 AI 升級(jí)搜索和輸入法雙引擎。搜索是走向問答,輸入法是走向?qū)υ挕?/p>
在讓搜狗從輸入法、瀏覽器、搜索的技術(shù)時(shí)代,進(jìn)入下一個(gè)技術(shù)時(shí)代的過程中,收入并非一件被忽視的事,但更高維的是,王小川希望用一種能真正回歸技術(shù)的方式,來探索收入增長模式的另一種可能性。