基于大數(shù)據(jù)的中醫(yī)文獻(xiàn)數(shù)據(jù)挖掘
掃描二維碼
隨時(shí)隨地手機(jī)看文章
引 言
根據(jù)第六次全國人口普查數(shù)據(jù)可知,我國農(nóng)村居民為 6.74 億人,看病貴問題依然突出,其癥結(jié)在于醫(yī)療保障體系不夠健全,大部分群眾就醫(yī)依然靠自費(fèi);公立醫(yī)療機(jī)構(gòu)傾向于市場化, 淡化了公益性質(zhì)。很多人普遍存在著 小病不用去醫(yī)院 的觀念,最終卻因?yàn)檫@些觀念被 小病 要了性命。
我國的中藥文化博大精深,源遠(yuǎn)流長。幾千年來,中國人形成了自己的用藥理念和方法。與西藥相比,中藥的優(yōu)勢在于它取自動(dòng)植物和礦物質(zhì),大部分屬于天然產(chǎn)物。因此,中藥的不良反應(yīng)輕于西藥,毒副作用較小。而且中藥與自然有著密切聯(lián)系,容易獲取。
本文的靈感來源于屠呦呦榮獲諾貝爾獎(jiǎng)事件。通過創(chuàng)建基于R 語言平臺(tái)的數(shù)據(jù)挖掘技術(shù),建立中藥數(shù)據(jù)庫,利用計(jì)算機(jī)代替人工進(jìn)行精確查找,大大提高了采集數(shù)據(jù)結(jié)果的準(zhǔn)確性、全面性、權(quán)威性,明顯縮短了數(shù)據(jù)挖掘所需時(shí)間,極大限度地減少了人力資源消耗。
1 研究方法
1.1 數(shù)據(jù)挖掘
基于歷朝歷代中醫(yī)古籍和國內(nèi)外權(quán)威中醫(yī)論文,挖掘出農(nóng)產(chǎn)品在所有中醫(yī)古籍中的相關(guān)記載以及某一類疾病在所有中醫(yī)古籍中的相關(guān)記載。
1.2 數(shù)據(jù)庫構(gòu)建
利用已擁有的中醫(yī)古籍和國內(nèi)外權(quán)威中醫(yī)論文及其他合作院校所提供的數(shù)據(jù)資料、網(wǎng)上發(fā)表的論文等有效研究資料可建立數(shù)據(jù)庫,通過搜索查找到中醫(yī)古籍對(duì)農(nóng)產(chǎn)品的描述。同理,如果想知道不同體質(zhì)的人群是否適合吃某一類農(nóng)產(chǎn)品,也可通過搜索獲得。根據(jù)這些參數(shù),利用統(tǒng)計(jì)軟件R,根據(jù)已建好的可靠的數(shù)據(jù)模型對(duì)數(shù)據(jù)進(jìn)行分析、計(jì)算,得到最佳健康結(jié)果,實(shí)現(xiàn)健康生活。數(shù)據(jù)庫的建立工作是長期的,因?yàn)殡S著時(shí)間推移,農(nóng)產(chǎn)品性質(zhì)會(huì)發(fā)生潛在變化,所以要時(shí)刻將最新數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫,及時(shí)更新。因此,應(yīng)詳細(xì)搜集全國各地區(qū)的農(nóng)產(chǎn)品資料并及時(shí)更新數(shù)據(jù),將其存入數(shù)據(jù)庫中,不斷完善數(shù)據(jù)庫,完善的數(shù)據(jù)庫會(huì)使分析結(jié)果更加準(zhǔn)確。山東農(nóng)業(yè)大學(xué)農(nóng)業(yè)大數(shù)據(jù)中心已經(jīng)搜集并存儲(chǔ)了多年的數(shù)據(jù)。
1.3 大數(shù)據(jù)平臺(tái)的構(gòu)建
本研究將在廣東超算中心(天河二號(hào))的基礎(chǔ)上構(gòu)建大數(shù)據(jù)分析與挖掘平臺(tái)。充分利用大數(shù)據(jù)平臺(tái)的資源構(gòu)建算法結(jié)構(gòu), 實(shí)現(xiàn)在中醫(yī)和農(nóng)產(chǎn)品大數(shù)據(jù)方面的采集、存儲(chǔ)、處理與分析挖掘等功能,以獲得更精準(zhǔn)的數(shù)據(jù)信息。研究 Linux平臺(tái)下數(shù)據(jù)庫的構(gòu)建及應(yīng)用,用以存儲(chǔ)農(nóng)作物相關(guān)參數(shù),實(shí)現(xiàn)在數(shù)據(jù)量大的情況下的快速檢索。
1.4 搭建應(yīng)用平臺(tái)
運(yùn)用數(shù)據(jù)庫等知識(shí)搭建好網(wǎng)站后臺(tái), 運(yùn)用Wordpress、PHP、JSP 等技術(shù)搭建網(wǎng)站前臺(tái)頁面,免費(fèi)提供給人們一個(gè)便捷、交互性強(qiáng)的平臺(tái)。所謂個(gè)性蘋果網(wǎng)站即為個(gè)例與健康的結(jié)合。建立了異于他人的雙向搜索界面,實(shí)現(xiàn)個(gè)性農(nóng)產(chǎn)品和個(gè)性用戶的雙向個(gè)性搜索;針對(duì)個(gè)性用戶、個(gè)性農(nóng)產(chǎn)品、個(gè)性群體、個(gè)性交流(社交),平臺(tái)開展了從每個(gè)個(gè)體的健康指導(dǎo)到相似群體的健康交流;個(gè)性蘋果項(xiàng)目為非營利項(xiàng)目。其顯著特點(diǎn)是為社會(huì)提供的服務(wù)和可供使用的功能不收取任何費(fèi)用,目的在于服務(wù)社會(huì)、服務(wù)人民,為人民提供便利與健康。
2 研究過程
個(gè)性蘋果網(wǎng)站搭建如圖 1 所示。
結(jié) 語
(1)個(gè)性用戶??蛻艨梢酝ㄟ^輸入自己獨(dú)特的健康狀態(tài), 查詢最符合自身狀況的可食用農(nóng)產(chǎn)品排名順序,得知自己最適 合吃的食物品種,哪些農(nóng)產(chǎn)品對(duì)自己的身體最有利,最能改善 自己的身體狀況,同時(shí)平臺(tái)也會(huì)為用戶篩選出忌食農(nóng)產(chǎn)品,食 用哪類農(nóng)產(chǎn)品不利于自身健康,甚至?xí)又夭∏?。通過食物療 法為每一位用戶提供個(gè)性化的健康保障方案!對(duì)于符合自己健 康狀態(tài)的農(nóng)產(chǎn)品,平臺(tái)將提供最權(quán)威、最安全的電商平臺(tái)的 相關(guān)鏈接。
(2)個(gè)性農(nóng)產(chǎn)品??蛻艨赏ㄟ^輸入某一種農(nóng)產(chǎn)品查詢到 忌吃某類農(nóng)產(chǎn)品的群體,通過比對(duì)得知自身狀況是否適合吃 此種農(nóng)產(chǎn)品,同時(shí)本研究利用中 / 西醫(yī)的研究成果,為每一位 用戶闡明原因。
(3)個(gè)性群體。研究團(tuán)隊(duì)為每一類群體提供健康計(jì)劃, 比如小孩、老人、孕婦、生病群體等。就小孩而言,可為每一 個(gè)年齡段、不同體質(zhì)的孩子提供健康成長計(jì)劃,從飲食、生活 起居等各方面為孩子提供一個(gè)有助于其成長的方案,同時(shí)用戶 再根據(jù)自身狀況,將自己的各項(xiàng)相關(guān)指標(biāo)反饋給平臺(tái),研究團(tuán) 隊(duì)可及時(shí)調(diào)整相關(guān)解決方案。
(4)個(gè)性交流(社交)平臺(tái)。相同群體交流 :根據(jù)用戶的 個(gè)性注冊(cè)信息,向用戶精準(zhǔn)推薦好友,為每一位用戶找到與自 己“志趣”相同的小伙伴,彼此交流各自的心得,為自己的健康、 成長、生活方式等找到更多的可參考方案 ;不同群體交流 :每 一位用戶都可以選擇自己感興趣的群體,平臺(tái)將根據(jù)用戶的選 擇,推薦每一位用戶想要交流的群體,使每一位用戶的生活 更加豐富多彩!(注:為保護(hù)用戶隱私,社交平臺(tái)不采用實(shí)名制)
(5)非營利性 :個(gè)性蘋果是為社會(huì)公眾提供健康指導(dǎo)的 非營利項(xiàng)目,其目的在于服務(wù)社會(huì)、服務(wù)人民,為大家提供便利。