視頻情景分析技術在視頻購物領域的探索
2012年卷積神經(jīng)網(wǎng)絡CNN在ImageNet中斬獲第一名,并且一超高的分類準確率遙遙領先第二名,從此深度學習革命迎來了高潮。其實在2000年以前深度學習的基本理論就已經(jīng)建立,只是當時激活函數(shù)選擇有誤,并且計算能力受限和數(shù)據(jù)量較小,今天隨著大數(shù)據(jù)時代的到來,這些問題都已經(jīng)被解決。深度學習的出現(xiàn)立刻給視頻廣告的展示形式帶了新的變化,曉推自研的視頻情景分析技術給也給視頻廣告行業(yè)帶了新的呼吸。
曉推自研的視頻情景分析技術可以識別出視頻中每一幀畫面的內容,并且打上特定的標簽,如圖1所示,該技術可以識別出畫面中的人物和物體等,并且分析出場景對應的標簽為party。
圖1.視頻場景分析技術
曉推所采用的基礎技術方案如圖2所示,我們將視頻的每一幀作為一張圖片進行處理,將圖片轉換為適合特征表示,然后交給神經(jīng)網(wǎng)絡進行分類,從而識別出圖像的內容。
圖2.算法識別流程
隨著互聯(lián)網(wǎng)的發(fā)展,【電商+視頻】這一購物模式已經(jīng)廣泛應用,例如某寶和某東等。而【直播+電商】這一顛覆性購物模式才初露端倪,可謂一片藍海。那么視頻直播購物又是什么?就是賣家通過視頻對著自己的商品進行邊錄邊播并與買家進行實時互動的購物形式。
曉推也希望在該視頻購物領域中發(fā)揮自己算法能力,我們將視視頻情景分析技術為視頻購物賦能,如圖3所示.這種符換視頻內容場景的實時貼片廣告能給用戶留下深刻影響,并且這次投放并不會過度打擾用戶觀看視頻的過程,因此會帶來極大的轉化率.
圖3.視頻場景分析技術在視頻購物中的應用
曉推技術團隊將每一個視頻分解成各種各樣的畫面幀作為一個特定場景的廣告位提供給各種各樣的廣告主(如電商),也可以為每一個廣告主特定分析和挖掘出特定的視頻場景。