大數(shù)據(jù)和人工智能如何防控疫情
新型冠狀病毒肺炎疫情爆發(fā)以來,相關(guān)話題熱度持續(xù)高漲。如何在紛繁蕪雜的信息中理清頭緒?為便于疫情防控和宣傳工作的開展,近日,清華大學(xué)人工智能研究院、RealAI共同研發(fā)推出“新冠肺炎疫情AI話題分析平臺”,幫助相關(guān)部門和公眾更好地了解疫情實(shí)時動態(tài)。
據(jù)介紹,該平臺通過對多渠道海量媒體信息進(jìn)行自動抓取采集、識別分析,解決了傳統(tǒng)信息檢索過程中因消息源頭繁雜、消息過多、檢索意圖不明確而產(chǎn)生的困擾。同時,基于大數(shù)據(jù)分析和AI建模,自動識別出近期熱點(diǎn)話題、新聞追蹤和話題導(dǎo)向、地區(qū)關(guān)注度變化,第一時間展示全網(wǎng)話題最新動態(tài),滿足用戶對疫情輿情監(jiān)測的需求。
在底層算法支持上,該平臺基于清華大學(xué)人工智能研究院、計算機(jī)系推出的WarpLDA主題提取算法研發(fā)?;诿商乜錏M算法,WarpLDA在訪存效率、并行度方面相比傳統(tǒng)的Gibbs采樣算法更有優(yōu)勢,可用于上億級別文本的主題提取。該成果最早首發(fā)于數(shù)據(jù)庫領(lǐng)域頂級國際學(xué)術(shù)會議VLDB上。
RealAI首席執(zhí)行官田天認(rèn)為,不同于2003年非典等重大公共衛(wèi)生突發(fā)事件,互聯(lián)網(wǎng)成為這次疫情主要的“信息源”平臺,傳播模式更是基于人手一機(jī)的“自媒體”,信息流的爆發(fā)不僅降低了大眾獲取信息的“信噪比”,更是滋生了不同程度的謠言。可以說,傳播速度之快、話題數(shù)量之大、更新變化之迅速都對疫情信息的有效傳達(dá)提出了更高的要求。
“在這場沒有硝煙的戰(zhàn)爭中,我們每個人、每個組織都無法獨(dú)善其身。”田天表示,RealAI希望以自身算法、優(yōu)勢技術(shù)為依托,從內(nèi)容側(cè)打造防疫戰(zhàn)線,發(fā)揮信息戰(zhàn)“疫”價值,為抗擊疫情貢獻(xiàn)力所能及的力量。