中國(guó)已經(jīng)擁有龐大的醫(yī)療數(shù)據(jù)基礎(chǔ) 但醫(yī)療數(shù)據(jù)質(zhì)量卻讓人擔(dān)憂
經(jīng)過(guò)20多年的醫(yī)療信息數(shù)據(jù)化,中國(guó)已經(jīng)擁有龐大的醫(yī)療數(shù)據(jù)基礎(chǔ)。據(jù) IDC顯示,全球醫(yī)療數(shù)據(jù)量2013年已達(dá)到153EB,2017年超過(guò)了600EB,預(yù)計(jì)到2020年將達(dá)到2.314PB。
也正是有了醫(yī)療大數(shù)據(jù)的深厚積淀,近年來(lái),在深度學(xué)習(xí)等AI技術(shù)興起后,不少創(chuàng)業(yè)公司嘗試?yán)米匀徽Z(yǔ)言理解、圖像識(shí)別等技術(shù)進(jìn)行臨床數(shù)據(jù)的清洗。在這個(gè)過(guò)程中,人們發(fā)現(xiàn),醫(yī)療數(shù)據(jù)的數(shù)量是夠了,但醫(yī)療數(shù)據(jù)質(zhì)量卻讓人擔(dān)憂。
在前不久2018深圳國(guó)際BT領(lǐng)袖峰會(huì)上,中國(guó)醫(yī)學(xué)科學(xué)院阜外醫(yī)院院長(zhǎng)胡盛壽在其主題演講中就曾提到,現(xiàn)階段醫(yī)療機(jī)構(gòu)的數(shù)據(jù)合格率若能達(dá)到50%到60%就已經(jīng)相當(dāng)不錯(cuò)了。
而現(xiàn)階段大部分人工智能企業(yè)在醫(yī)療數(shù)據(jù)的清洗過(guò)程階段,依舊要請(qǐng)大量有經(jīng)驗(yàn)的醫(yī)生專家進(jìn)行人工標(biāo)注,機(jī)器輔助,以此才能建模。
到底怎樣才能從一開(kāi)始就產(chǎn)生高質(zhì)量醫(yī)療數(shù)據(jù)?近日,在第80屆中國(guó)國(guó)際醫(yī)療器械博覽會(huì)上,浙江大學(xué)生物醫(yī)學(xué)工程與儀器科學(xué)學(xué)院教授、博士生導(dǎo)師呂旭東,軍事醫(yī)學(xué)研究院研究員趙東升、深圳中興網(wǎng)信科技有限公司醫(yī)療產(chǎn)品線總經(jīng)理張思昱等人,就“如何利用開(kāi)放式國(guó)際標(biāo)準(zhǔn)openEHR為建設(shè)高質(zhì)量、標(biāo)準(zhǔn)化醫(yī)療大數(shù)據(jù)問(wèn)題”發(fā)表了主題演講。
醫(yī)療大數(shù)據(jù)掀起的“波浪”
不論是國(guó)家、企業(yè)還是高校,近幾年,對(duì)于醫(yī)療大數(shù)據(jù)的“反響”都很大。
2015年,國(guó)務(wù)院發(fā)布了《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,其中明確了關(guān)于數(shù)據(jù)使用的總體要求。2016年6月底國(guó)務(wù)院又出臺(tái)《關(guān)于促進(jìn)和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見(jiàn)》,將醫(yī)療大數(shù)據(jù)正式納入國(guó)家發(fā)展,并對(duì)醫(yī)療大數(shù)據(jù)融合及共享開(kāi)放建設(shè),在醫(yī)療、醫(yī)藥、公共衛(wèi)生、醫(yī)保等方面的應(yīng)用,以及使用安全保障等方面進(jìn)行全面規(guī)范。2017年,國(guó)家重點(diǎn)企業(yè)牽頭組建了三家健康大數(shù)據(jù)企業(yè):中國(guó)健康醫(yī)療大數(shù)據(jù)產(chǎn)業(yè)發(fā)展集團(tuán)公司、中國(guó)健康醫(yī)療大數(shù)據(jù)科技發(fā)展集團(tuán)公司、中國(guó)健康醫(yī)療大數(shù)據(jù)股份有限公司。
在企業(yè)方面,隨著“Al+醫(yī)療”這塊蛋糕不斷擴(kuò)大,醫(yī)療大數(shù)據(jù)的重要性也在不斷凸顯,不論是藥企,醫(yī)療器械廠家、生命科學(xué)企業(yè)等各方,均想在其中分一杯羹。醫(yī)療大數(shù)據(jù)的市場(chǎng)規(guī)模也在不斷擴(kuò)大。據(jù)麥肯錫預(yù)測(cè),美國(guó)醫(yī)療大數(shù)據(jù)的市場(chǎng)規(guī)模為每年3000億至4500億美元,中國(guó)在醫(yī)療大數(shù)據(jù)領(lǐng)域也有上千億元的市場(chǎng)規(guī)模。對(duì)此,投資方也嗅到到了商機(jī)。而智研咨詢發(fā)布的報(bào)告也顯示,2018年第一季度,有關(guān)醫(yī)療健康大數(shù)據(jù)領(lǐng)域的投資就達(dá)35起,在大健康領(lǐng)域占比達(dá)22.2%。
在高校方面,產(chǎn)研結(jié)合一直是國(guó)家是大力提倡的。今年8月,經(jīng)中國(guó)衛(wèi)生信息與健康醫(yī)療大數(shù)據(jù)學(xué)會(huì)批復(fù),廈門(mén)大學(xué)成立了“廈門(mén)大學(xué)健康醫(yī)療大數(shù)據(jù)國(guó)家研究院”。10月,武漢大學(xué)又宣布成立“武漢大學(xué)健康醫(yī)療大數(shù)據(jù)國(guó)家研究院”,以促進(jìn)和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展。
利用openEHR,建設(shè)高質(zhì)量醫(yī)療大數(shù)據(jù)
醫(yī)療大數(shù)據(jù)的應(yīng)用領(lǐng)域可謂廣泛,包括智能輔診、新藥研發(fā)等。但不少企業(yè)在“快馬加鞭”的發(fā)展過(guò)程中卻發(fā)現(xiàn),醫(yī)療數(shù)據(jù)質(zhì)量低成了“絆腳石”。以臨床醫(yī)療數(shù)據(jù)為例,出現(xiàn)質(zhì)量低的原因主要有:
第一,醫(yī)生在使用臨床數(shù)據(jù)采集系統(tǒng)時(shí),病歷的書(shū)寫(xiě)標(biāo)準(zhǔn)不統(tǒng)一和不完整,特別是在大三甲醫(yī)院,醫(yī)生的日常工作量較大,很容易草率地對(duì)待電子病歷的填寫(xiě)。
第二,在醫(yī)院電子病歷數(shù)據(jù)處理環(huán)節(jié),醫(yī)療行業(yè)雖信息化程度很高,但數(shù)據(jù)化程度很低,絕大多數(shù)醫(yī)院已經(jīng)實(shí)現(xiàn)了HIS系統(tǒng)全覆蓋,通過(guò)HIS系統(tǒng)可以采集到不少患者數(shù)據(jù)。但由于患者信息的底層邏輯不清晰,使得這類(lèi)患者數(shù)據(jù)多數(shù)為非結(jié)構(gòu)化的文檔數(shù)據(jù),沒(méi)辦法直接做數(shù)據(jù)分析與應(yīng)用。
第三,是在數(shù)據(jù)質(zhì)控分析環(huán)節(jié),質(zhì)控團(tuán)隊(duì)對(duì)于數(shù)據(jù)的核查不夠認(rèn)真。這就容易讓垃圾數(shù)據(jù)通過(guò)審核,進(jìn)入到醫(yī)療大數(shù)據(jù)中。
在會(huì)上,浙江大學(xué)呂旭東就曾提出要利用openEHR從源頭來(lái)打造高質(zhì)量醫(yī)療數(shù)據(jù)。但目前看講,大部分人對(duì)于openEHR都比較陌生。
據(jù)顯示,openEHR是由國(guó)際openEHR組織于1999年提出的開(kāi)放式電子健康檔案規(guī)范。openEHR規(guī)范其核心在于將醫(yī)療領(lǐng)域知識(shí)從具體的臨床信息中分離出來(lái),并建立了兩層模型——參考模型和原型模型。參考模型是對(duì)信息系統(tǒng)中穩(wěn)定不變的概念進(jìn)行建模,定義了信息表達(dá)所需的基礎(chǔ)數(shù)據(jù)類(lèi)型和數(shù)據(jù)結(jié)構(gòu)。原型模型包括原型和模板,原型通過(guò)對(duì)參考模型添加約束的方式來(lái)定義臨床內(nèi)容,表達(dá)領(lǐng)域知識(shí);模板通過(guò)對(duì)原型的約束和定制,滿足實(shí)際應(yīng)用需求。
openEHR模型驅(qū)動(dòng)的開(kāi)放式醫(yī)療數(shù)據(jù)平臺(tái)可解決不同角色對(duì)數(shù)據(jù)需求動(dòng)態(tài)變化快,但各業(yè)務(wù)系統(tǒng)響應(yīng)、修改慢的問(wèn)題。此外,還可解決各類(lèi)醫(yī)療業(yè)務(wù)系統(tǒng)不斷增多,數(shù)據(jù)源持續(xù)增長(zhǎng)但又無(wú)法及時(shí)有效集成導(dǎo)致成為了數(shù)據(jù)孤島的問(wèn)題。
實(shí)際上,OpenEHR在歐洲、澳洲和日本等國(guó)家地區(qū)已經(jīng)得到了廣泛普及,并于2008年被國(guó)際標(biāo)準(zhǔn)組織接受,發(fā)展為ISO 13606-2標(biāo)準(zhǔn)。迄今,歐洲很多國(guó)家的全國(guó)電子健康檔案數(shù)據(jù)中心均采用該標(biāo)準(zhǔn),日本2015年新啟動(dòng)的全國(guó)電子健康檔案數(shù)據(jù)中心項(xiàng)目也計(jì)劃采用該標(biāo)準(zhǔn)。