編輯整理:王洪達(dá)
出品平臺:DataFunTalk
導(dǎo)讀:本文主要從偏向底層的推薦算法角度來闡述信息流推薦系統(tǒng)升級如何助力用戶增長。我們知道,內(nèi)容信息流實際上已經(jīng)算是信息流中比較小的概念,其中包含圖文信息流、短視頻信息流和內(nèi)容+電商信息流,而對于用戶來講實際上是一個消費(fèi)時間的產(chǎn)品體驗,從而對內(nèi)容生態(tài)產(chǎn)生很大的助力 ( 包括PGC、UGC的短內(nèi)容生態(tài) ),這就是本文主要的問題——內(nèi)容信息流。本文旨在解決的問題是:基于推薦算法視角,來解決信息流產(chǎn)品用戶增長的問題。其中,主要問題就是如何提升留存率。
01
關(guān)于用戶增長
頭部內(nèi)容模式:一種比較"重"的模式,該類產(chǎn)品利用精準(zhǔn)的內(nèi)容采買,引入優(yōu)質(zhì)的頭部內(nèi)容創(chuàng)作者,利用頭部內(nèi)容的流量聚焦效應(yīng),迅速圈定大批用戶,并形成內(nèi)容APP特有的用戶心智;但是由于內(nèi)容頭部化,個性化算法在其中發(fā)揮的空間和作用較小,產(chǎn)品模式趨于同質(zhì)化。
下沉/激勵模式:該類產(chǎn)品參考了網(wǎng)絡(luò)游戲模式,從各個環(huán)節(jié)設(shè)計用戶里程碑和激勵,不斷引導(dǎo)新用戶一步步完成點(diǎn)擊、下刷、完整閱讀、分享、關(guān)注等目標(biāo)里程碑,并給予虛擬貨幣和真實貨幣的激勵,在短時間內(nèi)可以獲取大量下沉用戶。
-
生態(tài)構(gòu)建模式:該類產(chǎn)品構(gòu)建了完善的內(nèi)容生產(chǎn)和消費(fèi)生態(tài),旨在通過推薦系統(tǒng)同時刺激生產(chǎn)和消費(fèi),實現(xiàn)兩端的同時增長。
-
用戶狀態(tài)建模:深度建模用戶狀態(tài)和行為,通過對于大數(shù)據(jù)集中分析,找到使用戶從低階狀態(tài)到高階狀態(tài)轉(zhuǎn)化的干預(yù)因子。也就是如何把新用戶轉(zhuǎn)化成低階用戶,然后從低階用戶轉(zhuǎn)化到高階用戶,用戶流失后如何召回,類似這樣的用戶狀態(tài)轉(zhuǎn)化。 -
個性化分發(fā)的升級:將用戶行為建模后,在多個場景下將這些干預(yù)動作轉(zhuǎn)化為個性化推薦和營銷,滿足用戶的消費(fèi)需求。

優(yōu)質(zhì)內(nèi)容/時效性:內(nèi)容的更新頻率以及內(nèi)容的質(zhì)量是用戶增長的關(guān)鍵。
個性化體驗:千人千面,推薦的內(nèi)容符合當(dāng)下的需求。
多渠道獲客:多渠道獲客的能力也是增長的一個關(guān)鍵因素。
CPC vs LTV:維持CPC ( 按點(diǎn)擊收費(fèi) ) 和LTV ( 用戶對系統(tǒng)的長期價值 ) 的一個平衡。
算法如何助力增長呢?主要有以下幾點(diǎn):
精細(xì)化買量/外投;
提升留存;
衡量推薦這樣Action的效用;
消除幸存者偏差。

-
劣質(zhì)系統(tǒng):只會推薦一些低俗 ( 只滿足低層次需求 )、興趣受窄、搬運(yùn)內(nèi)容 ( 無稀缺性 )、陳舊內(nèi)容的信息。 -
良性系統(tǒng):區(qū)別于劣質(zhì)系統(tǒng),在各個環(huán)節(jié)都會不斷增加信息量 ( 多樣性 ),不同層次的用戶引入 ( 用戶多樣性 ),各類高質(zhì)量內(nèi)容的引入 ( 內(nèi)容多樣性 ),內(nèi)容更具時效性 ( 提升媒體屬性 ),探索出用戶中長尾興趣:當(dāng)頭部內(nèi)容過期時從而更合理的承接。 -
問題在哪兒?主要存在以下問題:統(tǒng)計機(jī)器學(xué)習(xí)模型存在缺陷;長期的指標(biāo)觀測體系匱乏以及業(yè)務(wù)短視;缺乏合理的機(jī)制設(shè)計和產(chǎn)品視角。

-
衡量用戶滿意度的指標(biāo)有很多,但主要集中在三大方面:內(nèi)容相關(guān)性、內(nèi)容質(zhì)量和內(nèi)容時效性,時效性一定程度上代表內(nèi)容的稀缺性。 -
ctr代表什么:一定需要ctr嗎?對內(nèi)容無認(rèn)知的用戶需要衡量用戶對列表頁素材的滿意度,對內(nèi)容有認(rèn)知的用戶還需要衡量用戶對內(nèi)容本身的滿意度。 -
用戶對內(nèi)容真正的認(rèn)可是通過點(diǎn)贊、分享、評論這種互動的方式來表現(xiàn)的,目前很多產(chǎn)品注重對互動的引導(dǎo)。
-
提升用戶留存、LTV -
通過分發(fā)篩選出優(yōu)質(zhì)內(nèi)容、優(yōu)質(zhì)生產(chǎn)者:在傳統(tǒng)的認(rèn)知中,喜歡什么就給什么;但是更新后的認(rèn)知是創(chuàng)造需求和玩法,持續(xù)優(yōu)質(zhì)內(nèi)容生產(chǎn) -
構(gòu)建內(nèi)容生態(tài):提高分發(fā)時效性;增加對upgc主的激勵 ( 曝光、點(diǎn)擊、粉絲、分成 );通過準(zhǔn)入、扶持打壓、激勵這種機(jī)制維持一個好的生態(tài)和增長。只有通過用戶和生態(tài)兩端的同時增長,才能讓產(chǎn)品得到一個飛輪效應(yīng),良性發(fā)展
03
核心增長機(jī)制

-
基于表征學(xué)習(xí)的排序技術(shù),難以表達(dá)置信度;神經(jīng)網(wǎng)絡(luò)技術(shù)很難表達(dá)最重要的概念。 -
新內(nèi)容冷啟動技術(shù)選型業(yè)內(nèi)有很多的方案:隨機(jī)保量 ( 短期降效、對生態(tài)fairness問題相對友好、構(gòu)建寶貴的無偏數(shù)據(jù)集,消偏應(yīng)用 ) +Bandit類算法 ( 短程收斂性有一定劣勢 ) +uncertainty預(yù)估 ( 個人推薦 ) -
新用戶冷啟動的技術(shù)選型和新內(nèi)容還是有很大差別的,其主要是通過強(qiáng)化學(xué)習(xí)、聯(lián)邦學(xué)習(xí)這種人工智能的方式進(jìn)行分析,而通過統(tǒng)計學(xué),很難分析出人的偏好。

Rank = pRelevance(topic | user)^ cu * pCTR( item | topic)^ ci ?一方面用主題到用戶的相關(guān)性,另一方面用item到主題的統(tǒng)計值或者模型的估分,這里面會有兩個置信的概念,一個是用戶興趣的置信度,一個是item本身的置信度;
新item冷啟探索:ci低會提高cu,側(cè)重主題到用戶的相關(guān)性值以及預(yù)估穩(wěn)定性;
新用戶冷啟/興趣探索:cu低會提高ci,側(cè)重item到主題的統(tǒng)計值以及預(yù)估穩(wěn)定性;
純利用:對于老人做老事,ci高,cu也高,推薦的短期效率指標(biāo)是最高的,但是長期來看,如果只注重這種推薦的短期效率指標(biāo),不對新用戶和新內(nèi)容進(jìn)行探索,那長期就很難發(fā)展下去。

-
推薦模型本身的樣本就是有偏的,user和item偏同時存在,比如用戶沒看喜歡的部分沒有參與到模型訓(xùn)練中。 -
對應(yīng)到item,就是selection-bias和fairness問題。比較典型的案例是youtube net,user embedding average pooling本質(zhì)上,依然是item-embased,后續(xù)諸多改進(jìn)沒有本質(zhì)的解決消偏問題。這樣就會導(dǎo)致后續(xù)推的東西比較類似,如果第一次推的好就會留下用戶,推得不好用戶就會很快流失。

-
構(gòu)建反事實鏡像人:利用無偏信息構(gòu)建相似度量,構(gòu)建低活user到高活user的匹配 ( Matching / Propensity Score / IPW,Causal Embedding ) -
去除低活、沉默用戶的leavecause,推薦高活鏡像人的stay causes
①?狀態(tài)里程碑表示法


狀態(tài)躍遷效用衡量
找到使用戶從低階到高階狀態(tài)轉(zhuǎn)化的干預(yù)因子:
· 內(nèi)容變化:新內(nèi)容上下架、熱點(diǎn)事件的產(chǎn)生和消逝
· 捕捉興趣的變化
· 分發(fā)幸存者偏差問題
推斷后的數(shù)據(jù)統(tǒng)計到內(nèi)容采買和生產(chǎn)
干預(yù)場的設(shè)計和頁面組織
內(nèi)容供給指導(dǎo)?( 2b供應(yīng)鏈 )
構(gòu)建時間線上的的推薦系統(tǒng)來推斷個性化排序機(jī)制
①?個性化排序機(jī)制

-
新用戶首次滿意消費(fèi)和活動 ( 內(nèi)容質(zhì)量控制 ) -
低活用戶瀏覽深度和ctr ( 內(nèi)容質(zhì)量控制 ) -
高活用戶要增加新穎性和多樣性

-
興趣覆蓋度、興趣點(diǎn)下的內(nèi)容質(zhì)量、時效性、競爭激烈程度 -
內(nèi)容供給知道(2B供應(yīng)鏈->內(nèi)容采買/生產(chǎn)/激勵機(jī)制)
up主激勵機(jī)制:
up主質(zhì)量體系:關(guān)注量曲線、生產(chǎn)效率、生產(chǎn)質(zhì)量,內(nèi)容正負(fù)反饋
輸入就是歷史分發(fā)數(shù)據(jù)(曝光量、點(diǎn)擊量、關(guān)注量、up主質(zhì)量體系)
計算:
· 曝光量->爆款成功率
· 最大化效用:激勵函數(shù)->內(nèi)容質(zhì)量和生產(chǎn)效率的擬合
輸出就是一定時間內(nèi)up主內(nèi)容的保量、限量range->在線排序的調(diào)控約束機(jī)制
未來方向:
-
流量貨幣化 -
更多經(jīng)濟(jì)學(xué)、機(jī)制設(shè)計理論的引入 · 演化博弈論分析 · 競對分析
今天的分享就到這里,謝謝大家。
特別推薦一個分享架構(gòu)+算法的優(yōu)質(zhì)內(nèi)容,還沒關(guān)注的小伙伴,可以長按關(guān)注一下:
長按訂閱更多精彩▼
如有收獲,點(diǎn)個在看,誠摯感謝
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點(diǎn),不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!