2019 年兩會期間,由「分身技術(shù)」合成的 AI 女主播「新小萌」正式上崗新華社。這款產(chǎn)品是以新華社主播屈萌為原型,不僅會用自然連貫的人聲進行播報,就連唇形、面部表情也十分逼真。
這不是搜狗 AI 主播第一次引起轟動。2018 年的 11 月,搜狗分身技術(shù)第一次在媒體領(lǐng)域?qū)崿F(xiàn)落地—;—;以央視主持人新華社為原型的虛擬主播亮相烏鎮(zhèn)世界互聯(lián)網(wǎng)大會,眨眼、挑眉、唇動每個動作都自然得超過了預(yù)期,引得周圍不停有人駐足、拍照、詢問。
分身技術(shù),這種基于多種模態(tài)識別融合的技術(shù),包括語音、手寫、唇語等維度的識別和模擬,能通過數(shù)個小時的視頻資料就能合成一個比較逼真的真人形象。
這是搜狗上市后,在其 AI 故事框架活躍著的最新主角們。
有人質(zhì)疑繼語音筆后,搜狗又在自己的 AI 戰(zhàn)略中搞了新的「噱頭」。500 天以來,搜狗在人工智能方面取得的成績在外人看來卻有些火候欠佳。翻譯筆、虛擬主播以及在 3 月 18 日最新發(fā)布的錄音筆,這些看起來互不關(guān)聯(lián)的落地產(chǎn)品構(gòu)成了搜狗 AI 戰(zhàn)略的前行的一個個腳印。
但搜狗的 AI 技術(shù)落地產(chǎn)品真的是噱頭嗎?如何理解搜狗這些看似毫無關(guān)聯(lián)的產(chǎn)品?這些產(chǎn)品背后又體現(xiàn)了王小川哪些思考?為了解答這些疑問,我們在極客公園 IF 大會后和王小川聊了聊,也走進搜狗內(nèi)部與搜狗語音交互技術(shù)中心高級總監(jiān),同時也是新華社 AI 主播項目的負責人陳偉進行了交流。試圖理清搜狗正在真正講著的故事。
一個個頓號
自今近 500 天前,2017 年 11 月 9 日是屬于搜狗的高光時刻。在上市緘默期結(jié)束的六個小時之后,王小川第一次提出了公司未來的 AI 戰(zhàn)略—;—;以語言為核心。其中包括兩個部分:第一部分是人機交互,包括感知和認知層面對語言的理解,以及語音合成;第二部分以語言為核心,圍繞機器閱讀理解和推理能力,稱為知識計算。
這恰好是能完整地扣回到分身上的理念。據(jù)陳偉介紹,在形成基于從識別到理解、認知,再到表達整個閉環(huán)過程中,團隊里有兩條不同的大線,一條線在做語音交互,怎么能夠讓人機交互更自然;另一條做語音翻譯,語音同傳的能力。翻譯筆亦是如此,緊緊圍繞著公司 AI 戰(zhàn)略的核心。
熟知王小川的好友對極客公園說:「分身、智能硬件只是一個大方向上的子集,一種階段性成熟技術(shù)的應(yīng)用。不是終點,也不是下一個業(yè)務(wù),甚至不是逗號,是一個頓號?!箤τ谒压范裕禾栆馕吨蕴囟óa(chǎn)品作為階段性目標,而頓號只是一個個嘗試。在真正尋找下一個增長點時,搜狗還需要更多頓號去實驗和實踐。
他相信搜狗目前的這些看似分散的產(chǎn)品,最終拼湊成一張抵達王小川關(guān)于智能世界終極設(shè)想的藍圖:用 AI 解決跨語言隔閡問題,優(yōu)化人類溝通效率,「你可能現(xiàn)在并不能發(fā)現(xiàn)這一個個產(chǎn)品的關(guān)聯(lián),但是就像拼圖一樣,其實是在一個統(tǒng)一設(shè)想下進行的。」
這些產(chǎn)品不僅是圍繞著大方向演進,而且還有自身的商業(yè)價值。陳偉說,目前的 AI 分身項目已經(jīng)具備快速穩(wěn)定落地的能力,從語音識別到合成、唇語識別,到圖像方面的表情生成、肢體生成等,團隊已經(jīng)建立一套完整的流水線工作體系。未來除了在新聞主播領(lǐng)域之外,分身技術(shù)或?qū)⒃诳头?、教育、娛樂等場景落地,「商?wù)的事情是商務(wù)團隊正在談。」
智能硬件變現(xiàn)能力早已受到肯定。署名為 Himalayas Research 的科技股和全球消費買方分析師認為對搜狗的正確考量應(yīng)該是:「投資者應(yīng)該繼續(xù)關(guān)注廣告收入的趨勢,以及該公司的其他業(yè)務(wù)組成(微信搜索變現(xiàn)和智能硬件)能否開始對收入做出貢獻?!?/p>
理工男的技術(shù)信仰
從財報來看,搜索成了一塊旱澇保收的「自留地」。2018 年搜狗總營收達 11.2 億美元,同比增長 24%;美國通用會計準則下,歸屬于搜狗的凈利潤 9880 萬美元,同比增長 20%。其中,搜狗搜索和搜索相關(guān)營收為 10.2 億美元,較 2017 年增長 28%,僅 2018 年第四季度就達 2.77 億美元。
因此,對于外界而言,直到今天,廣告收入和流量成本仍然是考量搜狗的核心指標。Himalayas Research 在 2019 年 2 月的分析文章寫道:管理層預(yù)計,2019 年全年,以人民幣計算,行業(yè)總水平將以每年 10% 左右的速度增長,搜狗在 2019e 財年的表現(xiàn)應(yīng)該會更好,這意味著今年晚些時候的增長會加快。盡管如此,考慮到廣告空間的競爭越來越激烈,而 TAC(流量獲取成本) 的增長速度超過了收入的增長速度,這并不讓人印象深刻。
用產(chǎn)品獲取用戶,再用流量換得收入。這是市面上通行的游戲規(guī)則。
在互聯(lián)網(wǎng)還處于蠻荒拓展時期,這種流量為王的思維并不過時。不論是古老一些的 QQ,還是前兩年的瘋狂補貼的「外賣戰(zhàn)」,再到通過聚攏還沒有被挖掘的流量,從而短期獲得快速增長的拼多多、趣頭條都印證了這一想法。
技術(shù)、產(chǎn)品、流量,這三者中受重視的是后兩者,技術(shù)是退居幕后的角色。但王小川卻試圖打破這一默認規(guī)則,把技術(shù)作為搜狗的本質(zhì)?!竿跣〈ㄟ€是希望搜狗能堅持技術(shù)公司的本質(zhì),考慮到資本市場、股價等,很多人認為抓住流量變現(xiàn)是現(xiàn)在搜狗需要做。如果按照這樣的方式去考量搜狗的產(chǎn)品策略,就很難真正理解他的想法?!?/p>
在技術(shù)探索上,搜狗很慷慨。2019 年 2 月 1 日,搜狗公布了截至 2018 年 12 月 31 日全年未經(jīng)審計的財務(wù)報告。其中顯示,2018 年研發(fā)支出為 2.017 億美元,較 2017 年增長 17%,占總營收費用的 17.9%。而該項支出除了用于核心業(yè)務(wù)技術(shù)升級外,還用于探索分身技術(shù)、智能硬件等最新的商業(yè)應(yīng)用場景探索。
不過,在將技術(shù)作為攻克跨時代困擾的手術(shù)刀時,王小川也很清楚的認識到,搜索業(yè)務(wù)在搜狗內(nèi)部仍然是重要的驅(qū)動引擎。他曾在接受媒體采訪時表示,2018 年搜狗的核心戰(zhàn)略是通過 AI 升級搜索和輸入法雙引擎。搜索是走向問答,輸入法是走向?qū)υ挕?/p>
在讓搜狗從輸入法、瀏覽器、搜索的技術(shù)時代,進入下一個技術(shù)時代的過程中,收入并非一件被忽視的事,但更高維的是,王小川希望用一種能真正回歸技術(shù)的方式,來探索收入增長模式的另一種可能性。