大數(shù)據(jù)在醫(yī)療方面有什么作用
數(shù)據(jù)挖掘隨著計算機技術(shù)得到了廣泛應(yīng)用,從而提高了數(shù)據(jù)利用效率,拓展了知識發(fā)現(xiàn)的廣度與深度。數(shù)據(jù)挖掘已有較多成熟方法,并在醫(yī)學(xué)大數(shù)據(jù)挖掘中取得了一定成果。數(shù)據(jù)挖掘是指從數(shù)據(jù)庫中,提取隱含在其中的人們事先未知、潛在的有用的信息和知識的過程。目前,醫(yī)院已積累了大量醫(yī)療相關(guān)數(shù)據(jù)。
數(shù)據(jù)挖掘在醫(yī)學(xué)大數(shù)據(jù)研究中已取得了較多成果,通過文獻檢索,總結(jié)了三方面的應(yīng)用現(xiàn)狀。
疾病早期預(yù)警醫(yī)療領(lǐng)域往往需要更精確的實時預(yù)警工具,而基于數(shù)據(jù)挖掘的疾病早期預(yù)警模型的建立,有助于提高疾病的早期診斷、預(yù)警和監(jiān)護,同時,也有利于醫(yī)療機構(gòu)采取預(yù)防和控制措施,減少疾病惡化及并發(fā)癥的發(fā)生。
疾病早期預(yù)警,首先要收集與疾病相關(guān)的指標數(shù)據(jù)或危險因素,然后建立模型,從而發(fā)現(xiàn)隱含在數(shù)據(jù)之中的發(fā)病機制和病情之間的聯(lián)系。Forkan等采集日常監(jiān)測的心率、舒張壓、收縮壓、平均血壓、呼吸率、血氧飽和度等生命體征數(shù)據(jù),以J48決策樹、隨機森林樹及序列最小優(yōu)化算法等建立疾病預(yù)警模型,用于遠程家庭監(jiān)測,識別未曾診斷過的疾病發(fā)生,并將監(jiān)測結(jié)果發(fā)送到醫(yī)療急救機構(gòu),實現(xiàn)生命體征大數(shù)據(jù)、病人及醫(yī)療機構(gòu)的完整銜接,以降低突發(fā)疾病及死亡的發(fā)生率。
Easton等利用貝葉斯分類算法建立了中風(fēng)后遺癥死亡預(yù)測模型,認為中風(fēng)后遺癥死亡概率與中風(fēng)發(fā)生后的時間長短成函數(shù)關(guān)系,有助于中風(fēng)后遺癥患者的后續(xù)監(jiān)護。Tayefi等基于決策樹算法建立了冠心病預(yù)測模型,該模型發(fā)現(xiàn)hs-CRP作為新的冠心病預(yù)測標志物,比傳統(tǒng)的標志物(如FBG、LDL)更具特異性。
慢性病研究糖尿病、高血壓、心血管疾病等慢性病正在影響著人們的健康,識別慢性病危險因素并建立預(yù)警模型有助于降低慢性疾病并發(fā)癥的發(fā)生。Alagugowr等建立的心臟病預(yù)警系統(tǒng),從心臟病大數(shù)據(jù)庫中提取特征指標,通過K-means聚類算法識別出心臟病危險因素,又以Apriori算法挖掘高頻危險因素與心臟病危險等級之間的關(guān)聯(lián)規(guī)則。Ilayaraja等則以高頻項集尋找心臟病危險因素并識別病人風(fēng)險程度,該方法能夠回避無意義項集的產(chǎn)生,從而解決了以往研究中項集數(shù)量多、所需存儲空間大等問題。
CH Jen等對慢性疾病并發(fā)癥風(fēng)險識別的研究分三個步驟,首先,選擇健康人群體檢數(shù)據(jù)和慢性病患者相關(guān)疾病數(shù)據(jù),以帶有序列前項選擇的線性判別分析來尋找相關(guān)疾病的特征變量;然后,以K-NN對特征變量進行分類處理;最后,將K-NN算法的分類結(jié)果應(yīng)用于慢性疾病預(yù)警模型的建立。Aljumah等先后以回歸分析和SVM用于預(yù)測和判斷糖尿病不同治療方式與不同年齡組之間的最佳匹配,為患者選擇最佳治療方式提供依據(jù)。
Perveen等對糖尿病的預(yù)測研究,采用患者人口學(xué)數(shù)據(jù)和臨床指標數(shù)據(jù),并分別用Adaboost集成算法、Bagging算法及決策樹三種算法來建立預(yù)測模型,認為Adaboost集成算法的精確性更高。
輔助醫(yī)學(xué)診斷醫(yī)學(xué)數(shù)據(jù)不僅體量大,而且錯綜復(fù)雜、相互關(guān)聯(lián)。對大量醫(yī)學(xué)數(shù)據(jù)的分析,挖掘出有價值的診斷規(guī)則,將對疾病診斷提供參考。Yang等基于決策樹算法和Apriori算法,對肺癌病理報告與臨床信息之間的關(guān)聯(lián)性進行了研究,為肺癌病理分期診斷提供依據(jù),從而可回避診斷中需要手術(shù)方法獲取病理組織。
Becerra-Garcia等應(yīng)用SVM、K-NN和CART三種算法對眼球電圖進行信號預(yù)處理、脈沖檢測和脈沖分類,為研究臨床眼球電圖檢查中非自發(fā)掃視眼球運動的識別提供依據(jù)。彭玉蘭等對某醫(yī)院5年的乳腺超聲數(shù)據(jù)進行了關(guān)聯(lián)規(guī)則挖掘,建立乳腺病理診斷與超聲診斷之間的關(guān)聯(lián)規(guī)則,并開發(fā)了乳腺超聲數(shù)據(jù)庫數(shù)據(jù)檢索系統(tǒng),便于醫(yī)生快速獲得超聲診斷和病理診斷的各種診斷信息和病例信息。
醫(yī)學(xué)大數(shù)據(jù)挖掘已呈現(xiàn)廣闊的發(fā)展前景和巨大的應(yīng)用價值,將為疾病研究、臨床及管理決策、醫(yī)療服務(wù)個性化及圖像識別等眾多領(lǐng)域帶來更多支持。麥肯錫在其報告中指出,大數(shù)據(jù)分析可以幫助美國醫(yī)療服務(wù)業(yè)一年創(chuàng)造3000億美元的附加價值,而美國醫(yī)療協(xié)會也稱,改善醫(yī)療衛(wèi)生事業(yè)的關(guān)鍵在于大數(shù)據(jù)。
目前,醫(yī)院大數(shù)據(jù)中心、區(qū)域性衛(wèi)生信息平臺、國家醫(yī)療大數(shù)據(jù)中心的建立以及衛(wèi)生信息互聯(lián)互通標準和共享規(guī)范的制定,為數(shù)據(jù)存儲和共享、推動醫(yī)學(xué)大數(shù)據(jù)的應(yīng)用提供了更多支撐。未來,醫(yī)學(xué)大數(shù)據(jù)挖掘?qū)⒉粩喔拢剿餍碌难芯款I(lǐng)域,推動研究成果轉(zhuǎn)化。
來源:朗銳智科