人工智能是醫(yī)療行業(yè)革新的核心動力,科技巨頭和新興創(chuàng)業(yè)型公司紛紛布局AI醫(yī)療,這個領域的競爭日益激烈。
這是全球首次在頂級醫(yī)學雜志發(fā)表有關自然語言處理(NLP)技術基于電子健康記錄(EHR)做臨床智能診斷的研究成果,也是利用人工智能技術診斷兒科疾病的重磅科研成果。在以依圖科技為代表的人工智能企業(yè)驅動下,中國正逐步形成由勞動力輸出、技術輸出再到學術輸出的角色轉變,成為全球人工智能領域的重要力量。
成立于2012年的依圖科技,致力于人工智能創(chuàng)新性研究,將先進人工智能技術與行業(yè)應用相結合,服務于醫(yī)療健康、公共安全、金融等眾多領域,已經發(fā)展為國內不可或缺的人工智能領軍企業(yè)。作為國計民生相關的重要行業(yè),人工智能技術對醫(yī)療行業(yè)的巨大革新作用得到了社會的廣泛關注,去年的政府工作報告在談及加強新一代人工智能研發(fā)應用時首先點名醫(yī)療領域,高度重視高新技術對于健康中國2030計劃的推進作用。
依圖與廣州婦女兒童中心聯(lián)合研究的利用人工智能技術診斷兒科疾病的重磅科研成果,是通過深度學習與知識圖譜相結合,解構臨床電子病歷數(shù)據(jù),形成一套智能病種庫,并在其基礎上構建輔助診斷模型的技術。也就是說,有了這項技術,計算機能夠“讀懂”兒科病歷,并進行初步診斷。作為本文共同第一作者,依圖醫(yī)療CEO倪浩介紹,本次論文所述的是依圖在自然語言處理領域兩年多積累的成果,期間依圖進行了大量的基礎性研究,如知識圖譜的構建、算法的研發(fā)、標注體系的設計等。
這次研究中,依圖提出并測試了一個專門對電子醫(yī)學病歷進行數(shù)據(jù)挖掘的系統(tǒng)框架,將醫(yī)學知識和數(shù)據(jù)驅動模型結合在一起。該模型先通過自然語言處理技術對電子病歷進行標注,利用邏輯回歸來建立層次診斷,通過超過140萬的兒科病歷訓練,在常見兒童疾病方面的綜合診斷準確率優(yōu)于相對低年資兒科醫(yī)生(3年+8年臨床經驗)。
此次研究中,依圖與廣州市婦女兒童醫(yī)療中心進行合作,學習了該中心在2016年1月至2017年7月間的567498個門診病人的1362559次問診電子病歷,抽取到覆蓋初始診斷包括兒科55種病歷學中常見疾病的1.016億個數(shù)據(jù)點,并將這些信息用于訓練和驗證系統(tǒng)框架。相比以往的模型,此次研究使用了超過140萬的龐大數(shù)據(jù),以完善診斷系統(tǒng)。此外,此次研究中使用數(shù)據(jù)在表達和描述上的一致性,極大地提高了數(shù)據(jù)質量。
從該人工智能疾病診斷系統(tǒng)作出疾病判斷的準確率來看,以呼吸系統(tǒng)疾病為例,對上呼吸道疾病和下呼吸道疾病的診斷準確率分別為89%和87%,而在上呼吸道疾病診斷中,急性喉炎和鼻竇炎的準確率分別高達86%和96%,對不同類型哮喘的診斷準確率從83%到97%;同時對普通系統(tǒng)性疾病以及危險程度更高的疾病也有很高的診斷準確率,例如傳染性單核細胞增多癥(90%)、水痘(93%)、玫瑰疹(93%)、流感(94%)、手足口病(97%)和細菌性腦膜炎(93%)。也就是說,該系統(tǒng)可以根據(jù)NLP系統(tǒng)注釋的臨床數(shù)據(jù)信息對兒科疾病做出準確的判斷。
此次模型的訓練數(shù)據(jù)集中在兒科。倪浩表示,選擇兒科切入是本著一個非常樸素的想法——解決兒科醫(yī)生短缺的問題。另外,由于兒童沒有準確表達病癥的能力,因此被稱為“啞科”,發(fā)病占比較高,面臨病歷信息不全、患兒發(fā)病速度快等棘手問題。通過人工智能技術還原兒科醫(yī)生能力,能服務三甲醫(yī)院和基層醫(yī)院,可以取得較好的臨床及社會效益。目前整個系統(tǒng)已應用于廣州市婦女兒童醫(yī)療中心門診系統(tǒng)中,讀取醫(yī)生撰寫的門診病歷后,在填寫診斷的環(huán)節(jié)可以一鍵獲得輔助診斷結果。
由于醫(yī)療數(shù)據(jù)本身呈現(xiàn)多模態(tài)特征,自然語言處理技術的加入將為醫(yī)療領域帶來非常大的價值。與圖像識別、語音識別相比,自然語言處理是人工智能領域最為困難的問題之一,廣州市婦女兒童醫(yī)療中心主任夏慧敏教授表示:“這項研究,將會成為人工智能技術在醫(yī)療中實施應用的重要里程碑。其最大的貢獻在于,機器不僅僅能夠‘看圖’,而且能夠‘識字’,能像人類一樣讀懂文本中蘊藏的疾病信息。”
醫(yī)療人工智能企業(yè)的核心競爭力主要包括兩方面:技術實力和運用這一強大的技術去解鎖臨床應用場景的能力。此次研究得到Nature Medicine雜志的高度認可,其原因還在于其具備極強的多場景應用能力。例如在分診環(huán)節(jié),通過記錄基礎數(shù)據(jù)讓模型產生預測診療結果,并通過這個結果評估病人的優(yōu)先級,以確保醫(yī)生可以按需就診。
此外,基于AI的診斷模型還可以幫助醫(yī)生診斷復雜或罕見病癥,提示可能情況,避免由于醫(yī)生受限于自身專業(yè)或經驗,在遇到復雜病癥時出現(xiàn)誤診。
在過去的幾年,市場對于人工智能能夠實現(xiàn)的醫(yī)療價值已經從不認可到將信將疑,再到充滿信心,市場教育基本完成,未來三年預計會是一個快速增長的市場。十年內,中國醫(yī)療機構將完成初步的智能化,廣泛采用各類人工智能應用。