大數(shù)據(jù)+人工智能 搜狗智能化服務(wù)升級
搜狗大數(shù)據(jù)研究學(xué)院院長 李剛
從搜索引擎到輸入法,從大數(shù)據(jù)精準(zhǔn)營銷到智能兒童手表……搜狗成立13年來,一直走在大數(shù)據(jù)時代、人工智能時代的潮頭。
11月17日第三屆世界互聯(lián)網(wǎng)大會上,搜狗語音識別更是引起與會嘉賓的廣泛關(guān)注。作為人工智能方面的重要應(yīng)用,搜狗語音識別不僅能將現(xiàn)場講話實時識別為中文顯示在屏幕上,而且能將中文翻譯成英文。就搜狗大數(shù)據(jù)、人工智能發(fā)展布局,記者日前采訪了搜狗大數(shù)據(jù)研究院院長李剛。
大數(shù)據(jù)時代需要有大數(shù)據(jù)思維
問:搜狗發(fā)展大數(shù)據(jù)的優(yōu)勢是什么?
李剛:搜狗明確發(fā)展大數(shù)據(jù)是在2014年。當(dāng)時,大數(shù)據(jù)是產(chǎn)業(yè)的熱點,而搜狗擁有強(qiáng)大的流量、海量的數(shù)據(jù)。其中,搜狗搜索是我國第二大搜索引擎,占有無線搜索市場17.8%的份額。搜狗輸入法在我國PC端和移動端都是排名第一的產(chǎn)品。此外,搜狗擁有很強(qiáng)的技術(shù)團(tuán)隊,2500名員工80%是技術(shù)人員,40%擁有碩士以上學(xué)歷,技術(shù)團(tuán)隊有自己研發(fā)的專利和技術(shù)架構(gòu)體系。
問:搜狗成立大數(shù)據(jù)研究院的目的是什么?
李剛:在大數(shù)據(jù)時代,即使沒有大數(shù)據(jù)能力,也需要有大數(shù)據(jù)思維。
基于強(qiáng)大的數(shù)據(jù)實力和技術(shù)實力優(yōu)勢,2014年,搜狗專門成立了大數(shù)據(jù)研究院,主要的方向就是利用大數(shù)據(jù)實現(xiàn)精準(zhǔn)營銷;讓搜索更加智能,能夠為搜索提供準(zhǔn)確的答案;發(fā)展人工智能,讓人工智能技術(shù)和大數(shù)據(jù)很好地結(jié)合,在某些垂直領(lǐng)域能產(chǎn)生很好的效果。
我們通過自有的大數(shù)據(jù)平臺,還可以輔助客戶進(jìn)行商業(yè)決策,幫助企業(yè)進(jìn)行品牌定位等。
利用大數(shù)據(jù)實現(xiàn)精準(zhǔn)營銷
問:您認(rèn)為大數(shù)據(jù)如何改變著商業(yè)廣告和營銷?
李剛:傳統(tǒng)的營銷更多是給所有人看一樣的東西和內(nèi)容,給所有人看一個廣告,而精準(zhǔn)營銷給每個人看的廣告是不一樣的,需要用大數(shù)據(jù)分析每個人的想法、情況、個性、偏好、需求,給每一個人看不同的廣告和內(nèi)容。這需要強(qiáng)大的技術(shù)去讓廣告更加匹配用戶的需求。
在廣告領(lǐng)域,大數(shù)據(jù)可以更精準(zhǔn)地識別用戶,為所有人提供個性化的服務(wù)。這是大數(shù)據(jù)改變營銷的真正原因。
問:搜狗如何利用大數(shù)據(jù)實現(xiàn)精準(zhǔn)營銷?
李剛:搜狗利用大數(shù)據(jù)技術(shù),以多屏采集的數(shù)據(jù)層為基礎(chǔ),依據(jù)人口屬性、興趣屬性以及商業(yè)屬性給用戶群打標(biāo)簽,建立起精準(zhǔn)人群競價系統(tǒng)、網(wǎng)民人群流量切分系統(tǒng)。通過分析用戶行為和技術(shù)手段,搜狗為5.21億人群打上標(biāo)簽,一級標(biāo)簽包括幾十個一級分類、上千個二級分類、數(shù)十萬個三級分類。我們?yōu)橛脩舸驑?biāo)簽的準(zhǔn)確率已達(dá)90%以上,這樣就能夠?qū)崿F(xiàn)精準(zhǔn)營銷。
搜狗利用大數(shù)據(jù)技術(shù)已經(jīng)做到:不同用戶在搜狗搜索同一個關(guān)鍵詞時,其搜索結(jié)果和廣告展示結(jié)果都不一樣。搜狗擁有上億廣告庫,系統(tǒng)會根據(jù)用戶的性別、年齡、學(xué)歷、個人愛好等標(biāo)簽屬性,自動判斷為其推送哪些廣告。如果用戶經(jīng)常忽略推送的廣告,那么展示在其面前的廣告就會越來越少。
人工智能和大數(shù)據(jù)相互促進(jìn)
問:您認(rèn)為大數(shù)據(jù)和人工智能的關(guān)系是什么?
李剛:人工智能這兩年發(fā)展起來,是過去幾年在深度學(xué)習(xí)、計算量提升、語義理解等技術(shù)上不斷積累、突破、前進(jìn)的結(jié)果。今年,應(yīng)該是公眾對人工智能認(rèn)識的元年。
人工智能技術(shù)已經(jīng)成熟到可以應(yīng)用于語音識別、圖像識別以及搜索優(yōu)化等多個領(lǐng)域。比如搜狗搜索引擎,以前用戶搜索關(guān)鍵詞時,系統(tǒng)只會顯示與其最直接相關(guān)的結(jié)果。現(xiàn)在如果搜索“劉德華的年齡”,系統(tǒng)會直接告訴用戶結(jié)果是“55歲”。這樣就不僅只能搜索一個簡單的語義,而且可以通過邏輯關(guān)聯(lián),挖掘出用戶搜索查詢背后的思想,直接告訴用戶最終結(jié)果。
人工智能和大數(shù)據(jù)是一體的,所有的人工智能都成長于大數(shù)據(jù),如果沒有大數(shù)據(jù)的學(xué)習(xí)和訓(xùn)練就沒有智能,凡是有人工智能的地方都有大數(shù)據(jù)的基礎(chǔ)。人工智能和大數(shù)據(jù)是相輔相成的關(guān)系,結(jié)合應(yīng)用才能在某個領(lǐng)域產(chǎn)生更好的效果。如果在某個領(lǐng)域只有人工智能,沒有數(shù)據(jù)便無法產(chǎn)生很好的效果和體驗。如果沒有人工智能,只有大數(shù)據(jù)的話,人工智能也不知道該怎么用。兩者的關(guān)系是相互促進(jìn)、相互啟發(fā)。
問:大數(shù)據(jù)與人工智能的發(fā)展之路是什么?
李剛:人工智能和大數(shù)據(jù)的發(fā)展之路應(yīng)該是把這兩個技術(shù)落實到垂直領(lǐng)域的應(yīng)用場景里。這也必將對各個垂直領(lǐng)域的用戶體驗、效能和效益都帶來大的促進(jìn)和提升。
而這個垂直領(lǐng)域應(yīng)該有三個特點,一是有廣泛的用戶需求,二是和技術(shù)有很強(qiáng)的相關(guān)性,三是這個領(lǐng)域的數(shù)據(jù)采集很充沛,達(dá)到大數(shù)據(jù)規(guī)模。這樣的領(lǐng)域就是人工智能可以很好發(fā)揮價值的領(lǐng)域,比如輔助醫(yī)療、教育、生活服務(wù)、金融等。
人工智能是大數(shù)據(jù)的發(fā)展方向。對于搜狗來講,無論我們的輸入法,還是搜索,都會逐漸智能化。我們希望利用大數(shù)據(jù)與人工智能,讓搜狗能有更智能的產(chǎn)品產(chǎn)出,在更垂直領(lǐng)域為用戶提供更智能化地服務(wù)。