大數(shù)據(jù)如何幫我們抓“毒”
真實世界永遠(yuǎn)比我們想象的更出人意料。
研究顯示,零號新型冠狀病毒肺炎患者其實與華南市場并無直接關(guān)聯(lián)。他通過何種渠道感染病毒目前無從得知。零號患者體內(nèi)的病毒是否直接來源于野生動物或者野生動物的排泄物,還是另一個隱身于茫茫人海的病毒感染者?
目前,不得而知。
確定病原體的重要性
既然已經(jīng)知道了病毒,為何科學(xué)家還執(zhí)著地尋找源頭?面對《中國科學(xué)報》的采訪,香港大學(xué)公共衛(wèi)生學(xué)院教授朱華晨表示,確定來源才可以從源頭和根本上切斷傳播鏈,避免病原體的再次引入和再次暴發(fā)。
而確定病原體的來源需要做一系列的系統(tǒng)工作。首先是根據(jù)流行病學(xué)關(guān)聯(lián),找到患者可能接觸、暴露的現(xiàn)場,采集各類與病原體可能有關(guān)的標(biāo)本,看是否能檢測到類似病原體。
找到陽性病原體后,需要繼續(xù)向上追溯其來源,包括產(chǎn)地、運(yùn)輸過程、可能接觸與暴露的地方。然后把所有病原體全部測序,根據(jù)序列的縱向進(jìn)化和橫向親緣關(guān)系推斷病原體在不同宿主中傳播的來龍去脈。
雖然新冠病毒早已經(jīng)被證實了人傳人,但是否可能存在人傳動物,朱華晨認(rèn)為,也有可能,但無證據(jù)?!澳壳皞魅驹炊歼€沒搞清,這些就更不可能清楚了?!比绻娴目梢匀藗鲃游?,單純隔離人類的措施對疫情是否完全可控,朱華晨表示,仍有待商榷。
基于基因組大數(shù)據(jù)的防控策略
雖然尋找新冠病毒病原體的工作仍在繼續(xù),但借助二代測序技術(shù)對該病毒本身進(jìn)行研究難度并不大。
通俗地說,對于一個疑似患者的樣本,例如肺部灌洗液,目前的技術(shù)可以把各種可能的致病微生物的基因組DNA序列都讀出來,編成目錄。臨床醫(yī)生和技術(shù)人員可以直接閱讀這些“最底層”的信息,對比未發(fā)傳染病患者的樣本信息,快速發(fā)現(xiàn)可感染人類的新病毒。
據(jù)了解,單個冠狀病毒基因組大概在26kb~32 kb。這種長度對于目前測序技術(shù)而言,沒有特別困難之處,檢測成本也在可控范圍之內(nèi)。
然而,關(guān)鍵在于標(biāo)本的安全性以及對樣本間交叉污染的控制。而要排除污染,需要建立符合質(zhì)量控制和生產(chǎn)規(guī)模的高通量檢測實驗室,這需要花費(fèi)相當(dāng)?shù)臅r間。
此外,采訪中,專家還表示,隨著疑似患者樣本源源不斷送來,檢測機(jī)構(gòu)要能在有效時間內(nèi)抽提RNA并完成測序,然后與已知新冠病毒基因組數(shù)據(jù)進(jìn)行比對,以確定患者體內(nèi)是否感染新冠病毒。
不過,通過測序進(jìn)行診斷,成本和技術(shù)要求都較高。目前,主要通過聚合酶鏈?zhǔn)椒磻?yīng)(PCR)檢測診斷新冠肺炎。
科學(xué)家可以從病毒基因組大樣本數(shù)據(jù)中尋找出傳染能力最強(qiáng)的毒株,進(jìn)而快速理解傳染力的形成,并對之產(chǎn)生相應(yīng)的最有效防控策略。
而目前困局是,這樣大樣本病毒基因組數(shù)據(jù)庫是否存在。
以數(shù)據(jù)追蹤“可疑人群”
當(dāng)前,全國多數(shù)城市都采取嚴(yán)格手段遏制新型肺炎蔓延,這就可以通過用戶數(shù)據(jù)進(jìn)行采集加以控制。
對此,上海大數(shù)據(jù)聯(lián)盟常務(wù)副秘書長馬慧民告訴《中國科學(xué)報》,“非常時期用非常手段,只要確保采集到的個人位置數(shù)據(jù)僅用于疫情防控就可以。目前除了三大運(yùn)營商以外,微信、支付寶等都有用戶的基于位置服務(wù)的數(shù)據(jù)(LBS數(shù)據(jù)),通過整合感染人群的各種LBS數(shù)據(jù),就可以還原病毒的傳播軌跡。但是這些LBS數(shù)據(jù)的采集獲取和分析處理需要額外經(jīng)費(fèi)投入,隨感染人群規(guī)模擴(kuò)大而增加,由此產(chǎn)生的費(fèi)用由政府財政支出?!?/p>
“移動互聯(lián)網(wǎng)時代,大數(shù)據(jù)對于精準(zhǔn)疫情防控將會起到重要作用。每個人在哪個位置、去了哪里、跟什么人有接觸,都可以通過手機(jī)位置記錄下來?!瘪R慧民提議,此時,關(guān)鍵在于有效鎖定疫區(qū)人群,及時掌握疫區(qū)人群的流動以及人群到其他城市之后具體的分布。
那么數(shù)據(jù)從哪里來?馬慧民認(rèn)為,一是采取由面及點的做法,即把去年12月以來華南海鮮市場里的手機(jī)信息數(shù)據(jù)和各類交易信息都調(diào)出來,結(jié)合大數(shù)據(jù)平臺追蹤這些人群的流向,就可以還原重點人群分布和流動圖,形成對于疫情發(fā)展的總體判斷。二是采取由點及面的做法,即采用小程序,把已確診病例、疑似人群都管控起來,要求這類人群在小程序上及時登記填寫信息,通過大數(shù)據(jù)平臺將這些人群自登記之日前14天的活動軌跡還原出來,尋找到其中的密集場所,并形成高危場所數(shù)據(jù)庫統(tǒng)一對公眾發(fā)布,以便于公眾自我檢查。
之后,再結(jié)合醫(yī)療機(jī)構(gòu)獲得的病毒基因組數(shù)據(jù),就可以重點追查到強(qiáng)傳染性的潛在患者。
數(shù)據(jù)建立新信任機(jī)制戰(zhàn)疫情
此外,馬慧民認(rèn)為,還可以嘗試用區(qū)塊鏈記錄每個病例。這等于給患者和每個疑似病例建一條鏈,那么在患者這幾周出現(xiàn)的位置上的所有信息、與他(接觸)的人群都可以出現(xiàn)在這條鏈上。區(qū)塊鏈不可篡改,而且可以溯源。
其實,區(qū)塊鏈不僅僅可以應(yīng)用在防疫方面,還能在更大范圍內(nèi)起作用。
“比如,關(guān)于各類醫(yī)用物質(zhì)的使用去向、疫情早期到底被誰耽誤了等?!瘪R慧民表示,一種新的數(shù)據(jù)技術(shù),可以讓我們每個人從中獲得新的信任感。
這樣一來,新的信任機(jī)制建立不是靠人或機(jī)構(gòu)的承諾,而是新的數(shù)據(jù)平臺。
“真實世界永遠(yuǎn)比我們想象的更出人意料,因此人類面對自然必須要有謙卑的心態(tài)。”馬慧民說,從預(yù)防、溯源、治療、隨訪、追蹤、管理、物流、信息發(fā)布和問題解答等方面構(gòu)建大數(shù)據(jù)平臺,將湍流不息的數(shù)據(jù)和嗡嗡作響的機(jī)器轉(zhuǎn)化為對每個人的關(guān)懷,盡早打贏這場疫情阻擊戰(zhàn)。