今日頭條升級(jí)靈犬反低俗助手新增圖片識(shí)別功能

時(shí)間：2019-08-14 13:46:01

關(guān)鍵字：今日頭條今日頭條靈犬靈犬

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]7月30日消息，今日頭條宣布正式推出新版靈犬反低俗助手（以下簡(jiǎn)稱(chēng)“靈犬”），同時(shí)支持圖片和文本識(shí)別。這是時(shí)隔半年后，“靈犬”的又一次重要升級(jí)。用戶(hù)目前可以在今日頭條內(nèi)，搜索“靈犬”進(jìn)行試用。據(jù)了解

7月30日消息，今日頭條宣布正式推出新版靈犬反低俗助手（以下簡(jiǎn)稱(chēng)“靈犬”），同時(shí)支持圖片和文本識(shí)別。這是時(shí)隔半年后，“靈犬”的又一次重要升級(jí)。用戶(hù)目前可以在今日頭條內(nèi)，搜索“靈犬”進(jìn)行試用。

據(jù)了解，“靈犬”脫胎于今日頭條反低俗模型，是一款檢測(cè)內(nèi)容健康度的輔助小工具。字節(jié)跳動(dòng)人工智能實(shí)驗(yàn)室總監(jiān)王長(zhǎng)虎介紹稱(chēng)，2012年以來(lái)，今日頭條內(nèi)部搭建了反色情、反低俗、反標(biāo)題黨、反虛假信息、反低質(zhì)等數(shù)百個(gè)模型，并投入近萬(wàn)人專(zhuān)業(yè)審核團(tuán)隊(duì)。

王長(zhǎng)虎稱(chēng)，新版“靈犬”重點(diǎn)拓展了反低俗識(shí)別類(lèi)型和模型能力，現(xiàn)已覆蓋圖片識(shí)別（反色情低俗、反血腥暴力）和文本識(shí)別（反色情低俗、反暴力謾罵、反標(biāo)題黨）。后續(xù)還將支持語(yǔ)音識(shí)別和視頻識(shí)別。

此前一年時(shí)間內(nèi)，“靈犬”已陸續(xù)完成兩次迭代。2018年3月28日，今日頭條首次上線“靈犬”，支持檢測(cè)文字和文章鏈接。2018年5月16日，“靈犬”完成服務(wù)能力升級(jí)，增加反色情短文本模型和反謾罵模型，將準(zhǔn)確率從73%提升至82%。2019年2月20日，“靈犬2.0”正式上線，除了反色情低俗模型，加入反暴力謾罵和反標(biāo)題黨模型，覆蓋了主要的低俗低質(zhì)內(nèi)容類(lèi)型，整體識(shí)別準(zhǔn)確率接近85%。

用戶(hù)只需要在“靈犬”內(nèi)輸入一段文字或文章鏈接，“靈犬”就可以幫助其檢測(cè)內(nèi)容健康指數(shù)，返回一個(gè)鑒定結(jié)果。對(duì)于用戶(hù)輸入的內(nèi)容，“靈犬”會(huì)先進(jìn)行提取、分詞和語(yǔ)義識(shí)別，然后根據(jù)相關(guān)規(guī)則，輸出對(duì)應(yīng)的分?jǐn)?shù)、評(píng)級(jí)和結(jié)論。這一切都在短短幾秒內(nèi)完成。圖片和圖片鏈接檢測(cè)同理，用戶(hù)在“靈犬”內(nèi)上傳圖片或圖片鏈接，即可快速獲取鑒定結(jié)果。

據(jù)王長(zhǎng)虎介紹，“靈犬”背后的文本分類(lèi)模型，已經(jīng)經(jīng)過(guò)了三次迭代。每個(gè)新版本相對(duì)于舊版本，在技術(shù)和數(shù)據(jù)集層面，都有一個(gè)明顯的躍升。這一代“靈犬”訓(xùn)練數(shù)據(jù)集總量是1.2個(gè)T，相當(dāng)于20倍百度百科或100倍維基百科的數(shù)據(jù)總量，包含920萬(wàn)個(gè)樣本，準(zhǔn)確率提升至91%。

在圖片識(shí)別層面，“靈犬”采用深度學(xué)習(xí)作為解決方案，在數(shù)據(jù)、模型、計(jì)算力等方面均做了針對(duì)性?xún)?yōu)化。數(shù)據(jù)層面，“靈犬”已累積上千萬(wàn)級(jí)別的訓(xùn)練數(shù)據(jù)。模型層面，“靈犬”針對(duì)許多困難樣本做了模型結(jié)構(gòu)調(diào)優(yōu)，嘗試解決多尺寸、多尺度、小目標(biāo)等復(fù)雜問(wèn)題。計(jì)算力層面，“靈犬”利用分布式訓(xùn)練算法以及GPU訓(xùn)練集群，加速模型的訓(xùn)練和調(diào)試。

截至2019年6月，靈犬反低俗助手的使用人次已經(jīng)超過(guò)了300萬(wàn)。