在人工智能時代挖掘醫(yī)療數(shù)據(jù)的價值
人工智能成功的關(guān)鍵在于擁有大量且高質(zhì)量的數(shù)據(jù), 但是把醫(yī)療數(shù)據(jù)變成真正的有價值的商品之前還有很多的工作要做。(以下文中提到的AI即人工智能)。
AI在醫(yī)療保健行業(yè)所面臨的挑戰(zhàn)正如阿瑪拉定律所言:人們總是高估一項新科技所帶來的短期利益,卻低估其長期影響。
在創(chuàng)新技術(shù)的起伏發(fā)展變化上,羅伊·阿瑪拉的看法與同樣流行的高德納技術(shù)成熟度曲線高度一致,他認為以短期的眼光來看待技術(shù)是很危險的,這些技術(shù)雖然沒有清晰或者立即的投資回報,但是從長遠的眼光來看,它們回報是非??捎^的。
醫(yī)療保健機構(gòu)正在努力地用它們解決業(yè)務(wù)問題的方式去理解AI的短期價值。AI確實在其他行業(yè)達到了預(yù)期的大規(guī)模轉(zhuǎn)變,然而它卻不能應(yīng)用到大部分的醫(yī)療健康系統(tǒng)中。
雖然媒體廣告大肆渲及銷售竭盡所能的推廣適配這些變革性的技術(shù)。但醫(yī)療保健提供商們?nèi)栽谌鉀Q數(shù)據(jù)孤島和阻礙他們技術(shù)進程的優(yōu)先級問題,幾乎沒有能力做長遠的計劃。但是在2019世界醫(yī)學(xué)創(chuàng)新論壇上,來自Partners HealthCare和哈佛醫(yī)學(xué)院(Harvard Medical School)的醫(yī)生、研究學(xué)者和工程師從來沒有低估AI對醫(yī)療行業(yè)的長遠影響。實際上,他們擔心醫(yī)療體系沒有足夠的能力來抵制廣告媒體大肆渲染的影響、沒有為AI在未來幾十年將帶來的根本性變化做好充分的準備。在持續(xù)三天的論壇上,很多專家表示: 醫(yī)療服務(wù)提供商,醫(yī)療服務(wù)的消費者和病人需要對彼此之間的互動方式以及理解疾病”和“健康”的概念做出重大調(diào)整。
研發(fā)機構(gòu)需要重建他們對大數(shù)據(jù)的思考方式:哪些數(shù)據(jù)類型是有用的,如何分享數(shù)據(jù),如何使用算法避免對分析結(jié)果產(chǎn)生人為的偏見。因為這對削減開銷和提高研究成果是非常重要的。而管理者則需要根據(jù)變化及時調(diào)整隱私和安全的框架,更多的關(guān)注真實的案例,持續(xù)監(jiān)控相關(guān)算法的安全和效率。
CMS的高層向HealthITAnalytics.com透露,"現(xiàn)在我們正處于如何使用數(shù)據(jù)提高醫(yī)療保健系統(tǒng)的關(guān)鍵時刻 - 向數(shù)字化轉(zhuǎn)變的好時機。"“AI日趨成熟;數(shù)據(jù)間的相互影響也開始在提高;以客戶為驅(qū)動的醫(yī)療保健正越來越強健。我們需要這些話題,讓這些話題將持續(xù)一段時間。"
要對一個保留了許多前啟蒙傳統(tǒng)的系統(tǒng)實現(xiàn)大規(guī)模轉(zhuǎn)變不是一件容易的事。
如果投資者不能透過近期的廣告看其本質(zhì),缺乏長遠的眼光,不能同心協(xié)力地為未來建立一個平等、相互合作、以研究為動力的醫(yī)療保健系統(tǒng),AI就不可能實現(xiàn)其潛能。
通過使用交互信息獲得主動性
發(fā)言人表示除了編程創(chuàng)新外,AI還需要重新審視數(shù)據(jù)在治療,或者更好的預(yù)防常見及罕見疾病方面的作用。
風(fēng)險投資公司Flagship Pioneering的創(chuàng)始人及CEO Noubar Afeyan說:“我想要看到一個全新的醫(yī)療保健挑戰(zhàn)定義,尤其在早期的檢查和預(yù)防方面?!薄拔覀儜?yīng)該像考慮國家安全的一樣來考慮醫(yī)療健康。 我們沒有恢復(fù)和平部門但有國防部, 因為我們的目標是讓敵人遠離我們的領(lǐng)土,而不是在他們?nèi)肭值臅r候消滅他們?!彼^續(xù)說道, 國家的智能服務(wù)幫助我們在敵人進攻前辨別和消滅他們。AI應(yīng)該在醫(yī)療保健中扮演相同的角色:通過更積極主動的檢查、監(jiān)視在疾病變異之前找到其變異的根本原因。
專家組展示"在2054年的影像醫(yī)學(xué)"
在一次采訪中,Brigham & Women’s Hospital (BWH)心血管醫(yī)學(xué)主任,醫(yī)學(xué)博士Calum MacRae說道,為了做到以上這些,醫(yī)療保健系統(tǒng)需要學(xué)會如何獲得更多不同的個人信息,比如他們的生活方式、生活的環(huán)境等等。
MacRae說:“在醫(yī)學(xué)上,我們更相信我們一直相信的信息, 但是我們知道臨床數(shù)據(jù)只代表了一小部分數(shù)據(jù),而這些數(shù)據(jù)能真正的預(yù)測結(jié)果?!?/p>
在醫(yī)療行業(yè)被廣泛接受的觀點:80%以上的診斷結(jié)果標明患病的原因與非臨床因素有關(guān),比如經(jīng)濟狀態(tài),教育程度,日常飲食和其他的健康社會因素。
但是追蹤和解決這些對個人健康有影響的共同因素是提供商的面臨的一個主要挑戰(zhàn)。
服務(wù)費用償還模式,尷尬的立法環(huán)境和根深蒂固的社會不平等也是問題的一部分?!霸卺t(yī)學(xué)上,我們更相信我們一直信任的信息。”
事實上,現(xiàn)在醫(yī)療行業(yè)并沒有獲取,分析和利用非傳統(tǒng)數(shù)據(jù)集的能力,但是這些數(shù)據(jù)包含了如何、何時患上慢性疾病的重要線索。
MacRaeq強調(diào)說:“我們需要開始利用在日常生活中搜集到的數(shù)據(jù):GPS數(shù)據(jù);通過手表獲得的加速測量數(shù)據(jù);看電視的習(xí)慣;信用卡賬單?!?同時也需要著手考慮如何以安全、可控的方式使用收集的信息自檢自己的行為,而不是需要通過醫(yī)務(wù)人員診斷后才知道我們的身體狀況。"
搜集和理解這些新數(shù)據(jù)集的技術(shù)和流程無疑是主要的障礙。但是一旦潛在的看法觀念改變了,對從事醫(yī)療的開發(fā)人員和服務(wù)商而言,部署革新的篩查策略及風(fēng)險分級策略就變得迎刃而解。
MacRae說:“我們需要重新訓(xùn)練系統(tǒng), 現(xiàn)在我們所認為的缺陷在未來將都是特色,但是現(xiàn)在我們沒有良好的社會氛圍,或者坦白的說沒有正確的賠償模式將這些數(shù)據(jù)應(yīng)該到醫(yī)療實踐中?!?/p>
在構(gòu)建AI驅(qū)動關(guān)懷的文化時應(yīng)避免偏見
對于困擾醫(yī)療保健的問題并沒有一勞永逸的辦法,也沒有一種單一的方法能把“生病-醫(yī)治”的系統(tǒng)模式變成類似于健康部門的預(yù)防模式。
相反,改變是循序漸進的的, 從這一代研究者和臨床醫(yī)生開始:開發(fā)AI工具、解決最基本的問題(比如獲取數(shù)據(jù),消除算法偏見,逐步培養(yǎng)醫(yī)生對AI的信心)。
在過去的兩三年里, 由于創(chuàng)新爆發(fā),產(chǎn)生了成千上萬的實驗性項目、研究合作項目以及有前途的創(chuàng)業(yè)公司,它們都希望研究出對患者護理有巨大影響力的AI算法。
其中很多項目已經(jīng)證明在具有針對性和良好控制的應(yīng)用中,AI已經(jīng)足夠精密、先進地提高臨床工作流程,尤其是對是病理學(xué)家,放射科醫(yī)師和其他診斷專業(yè)來說。
Massachusetts General Hospital (MGH)乳腺成像部門主任,哈佛醫(yī)學(xué)院放射學(xué)教授,醫(yī)學(xué)博士Constance Lehman說:AI有可能解決乳房X光檢查中最主要的挑戰(zhàn)之一:減少個體間理解的差異。
她解釋說:“身體中的一些組織結(jié)構(gòu)能夠精確測量,所以當它們發(fā)生變化時能夠很容易的發(fā)現(xiàn)。而其他組織則不然,放射科醫(yī)生正在研究那些組織結(jié)構(gòu)間非常微妙的地方。乳房X光檢查可能是其中最極端的例子之一。我們在正常健康而不是特殊的腺體組織中尋找其紋理和陰影的差異,而且對每個女性來說,每個乳房X線照片都像指紋一樣,每一張都是不一樣的?!啊比说拇竽X并不能很好的處理這類工作,而且會由于理解的不同而結(jié)果不同?!?/p>
在她之前發(fā)表的研究報告中指出:在獲得專業(yè)認證的乳房成像放射科醫(yī)師中,只有40%能在正常范圍之外找到令人滿意的特征。雖然一些放射科醫(yī)師能標明不到10%的乳房組織是密集的(乳房組織的密集程度是乳腺癌發(fā)展的一個關(guān)鍵風(fēng)險因素),但其他人用相同的方式在乳房線光片中能標記出80%以上的密集組織。
Dr. Lehman在她"第一眼"的演示研究創(chuàng)新會上
在她之前發(fā)表的研究報告中指出:40%經(jīng)過認證的乳房成像放射科醫(yī)師能在推薦范圍之外診斷出可接受的特異性。雖然一些放射科醫(yī)師能標明不到10%的乳房組織是密集的(乳房組織的密集程度是乳腺癌發(fā)展的一個關(guān)鍵風(fēng)險因素),但其他人能通過X光片以相同的方式標記80%的乳房組織密集。Lehman開發(fā)了一套深度學(xué)習(xí)工具,在識別患乳腺癌高風(fēng)險人群方面比人類更準確,它也是在美國排名第二的女性癌癥診斷工具.
深度學(xué)習(xí)算法可能比人判斷的更全面,因為人可能會外界因素的影響,如果其先入為主的觀念,或者病人的病史,或當時的經(jīng)濟條件。“計算機沒有這樣的考量,除非人為控制。如果靠算法幫我們做決定, 我們會為算法提供補充的風(fēng)險信息,但是我們僅僅是讓它根據(jù)圖片數(shù)據(jù)獲得更客觀的診斷結(jié)果。”
理解和公正性之間找得平衡是培養(yǎng)臨床醫(yī)生之間的信任關(guān)鍵因素,而臨床醫(yī)生通常對在決策過程中出現(xiàn)任何新內(nèi)容都會持懷疑態(tài)度。Lehman說,無法察覺的偏差算法可能是AI工具失敗的最根本原因。
她用一個新的辨別骨盆骨折的算法說明:“我們見到的很多問題并沒有在AI領(lǐng)域討論過,而這些問題僅僅是一些皮毛而已?!?/p>
“事實證明是, 辨別骨盆骨折的模型是通過學(xué)習(xí)可移動設(shè)備拍的X光而推斷出患有骨折的可能性。而這些圖片是因為病人因為太過疼痛無法起床的情況下用可移動設(shè)備拍攝的,確實這類病人有很大可能有骨盆骨折”
Lehman她自己也遇到過類似的問題,因為算法不是足夠聰明能自動去除偏見。 這也說明要消除算法的偏見是相當困難的 – 即便我們正在試圖解決它?!霸谖覀兊脑缙趯嶒炛校覀冇冒┌Y數(shù)據(jù)來訓(xùn)練我們的模式 -因為這對我們來說相對簡單。所以算法能很快地學(xué)習(xí)到判斷帶有癌癥數(shù)據(jù)圖片,但不能判斷超過這么范圍以外的圖片。 但這不是我們期望的?!薄熬拖胨鼈儽辉O(shè)計的樣,我們希望這些算法是非常非常的智能。在將來,即使在數(shù)據(jù)質(zhì)量糟糕的情況也會有卓越的表現(xiàn)?!?/p>
Lehman是做學(xué)術(shù)研究的,不用面對商業(yè)化的壓力。但在創(chuàng)業(yè)的領(lǐng)域,上市時間對成功至關(guān)重要,研發(fā)人員可能甚至沒有足夠重視創(chuàng)建無偏差產(chǎn)品。“就想它們被設(shè)計的樣,我們希望這些算法是非常非常的智能。在將來,即使在數(shù)據(jù)質(zhì)量糟糕的情況也會有卓越的表現(xiàn)”
Lehman注意到:“現(xiàn)在的AI市場就像是拓荒前的美國西部,令我驚訝的是,幾乎沒有人關(guān)注至關(guān)重要的質(zhì)量評估。"“因此,我們需要與業(yè)界同事以及政府和學(xué)術(shù)中心建立密切的合作關(guān)系,以確保我們以負責(zé)任的方式實現(xiàn)這些工具?!?/p>
確保研發(fā)人員不再復(fù)制現(xiàn)在醫(yī)療保健系統(tǒng)已存在的偏見,這對信任和接受AI工具是十分重要的。
獲得大量數(shù)據(jù)是AI成功的關(guān)鍵
MacRae指出, 數(shù)據(jù)單一是算法引入偏見問題的原因之一。
收集完整、準確、實時和具有代表性人群的大規(guī)模數(shù)據(jù)對分析專業(yè)人員來說是一項長期挑戰(zhàn),而缺乏數(shù)據(jù)正成為訓(xùn)練AI模型的阻礙。
他說:“其中一個問題是我們?nèi)匀辉谝阅涿踩姆绞秸心蓟颊?,而不是以?shù)據(jù)貢獻的方式,也期望與醫(yī)療保健系統(tǒng)合作?!薄拔覀兺ㄟ^只研究非常小的一部分個體,然后對整個群體做出推論,這是難以讓人信服法。我們做的應(yīng)該恰好與之相反,應(yīng)該研究大量的人群,然后把這些觀點應(yīng)用到個體身上?!?/p>
Partners HealthCare的醫(yī)療健康數(shù)字化首席官,MBA,MD Alistair Erskine同意這個觀點, 他說在算法模式訓(xùn)練和驗證階段沒有包括足夠有意義的數(shù)據(jù), 可能會對算法的精確度和應(yīng)用性有重大的影響。
他還說: "數(shù)據(jù)的來源, 數(shù)據(jù)量和數(shù)據(jù)質(zhì)量, 都會對最終建立的模型產(chǎn)生巨大的影響。"“在真正驗證結(jié)果之前, 模型必須要在并行的數(shù)據(jù)集上再次驗證,數(shù)據(jù)集應(yīng)包括來自不同地方、性別、種族的病人,還有其他臨床并發(fā)癥。如果你不注意這些步驟, 你就會引入潛在的偏見, 影響到最后的結(jié)果。"
Lehman指出, 為驗證模型而獲取額外的高質(zhì)量數(shù)據(jù)甚至比搜集最先的訓(xùn)練數(shù)據(jù)要困難的多。她說:“你可以很簡單的說你已經(jīng)做過外部驗證,但是如果是由于便利而在醫(yī)院附近搜集數(shù)據(jù)進而利用這些數(shù)據(jù)驗證模型, 這有可能造成驗證模型的數(shù)據(jù)和訓(xùn)練模型的數(shù)據(jù)非常相似。 所以這個算法就不能成為一個能為任何人帶來好結(jié)果的工具。 "
“我們正在多個地方驗證在Mass General研發(fā)的乳腺癌風(fēng)險識別算法,比如底特律(Detroit)的亨利·福特醫(yī)院(Henry Ford Hospital),在那里非裔美國女性占相當大部分比例。”
Lehman強調(diào): "如果希望我們的模型在不同程度的情緒狀態(tài)、不同年齡段以及不同的社會經(jīng)濟條件下是穩(wěn)健, 我們就需要與其他地區(qū)的人群建立合作關(guān)系, 并努力把他們納入我們的考量范圍內(nèi)。
改變AI數(shù)據(jù)搜集的方式
MacRae 表示,要消除偏見和挖掘數(shù)據(jù)價值,需要在一定程度上徹底改變醫(yī)療行業(yè)及消費者看待數(shù)據(jù)的觀念。
他說: "在其他行業(yè), 數(shù)據(jù)共享是事實。當你使用 Uber 或 Google 時, 你就是在向該模型貢獻你的數(shù)據(jù), 并幫助它們優(yōu)化其算法, 改進為你和其他消費者提供服務(wù)的能力?!彼赋? 當消費者可能會感到不安當他們知道自己的數(shù)據(jù)被商品化時, 但總體來說, 他們并不會改變他們的行為, 甚至沒有停止使用特定公司的服務(wù)。
他說:“在Facebook 和Cambridge AnalyTIca發(fā)生信息泄露之前,一切運行正常。在事件之后,人們都瘋了,每個人花了一秒的時間在想發(fā)生了什么。但是他們并沒有大規(guī)模的停止使用Facebook。在衡量之后,仍然再分享他們的個人信息?!?/p>
MacRae明確表示, 這并不是說醫(yī)療行業(yè)就該像某些世界級巨頭科技一樣, 對數(shù)據(jù)隱私和安全掉以輕心。
但是在利用消費者已經(jīng)產(chǎn)生的數(shù)據(jù)方面還是有改進的余地。
他繼續(xù)道:"我認為醫(yī)療至少和與保持聯(lián)系的大學(xué)老室友一樣重要。 但事實是, 當我們想到一個醫(yī)療組織利用我們的數(shù)據(jù)進行研究時, 我們還是有一定程度的憤慨或憤怒 。但作為醫(yī)療組織我們也沒有做什么來解釋為什么它們是不同的。"
他說, 讓患者相信, 如果更自由地分享數(shù)據(jù), 他們的健康能得到改善。 這是一個重要的起點。"我認為醫(yī)療至少和與保持聯(lián)系的大學(xué)老室友一樣重要"“還有一種意識是:人們不分享他們的數(shù)據(jù), 是因為他們得不到任何回報。 如果我們能告訴病人, 我們正在利用他們的臨床數(shù)據(jù)和電視數(shù)據(jù)來預(yù)測老年癡呆癥的風(fēng)險, 這難道不值得讓我們在安全的條件下獲取他們的數(shù)據(jù)嗎? 但沒有人提供這些證據(jù),所以錯失了一個巨大的機會。
MacRae并不是唯一一個在世界醫(yī)學(xué)創(chuàng)新論壇上表示對無法獲得訓(xùn)練強健AI模型所需規(guī)模數(shù)據(jù)感到沮喪的人。
幾乎每個會議, 無論其主題是什么, 都會強調(diào)鼓勵病人為研究貢獻他們的數(shù)據(jù),由于商業(yè)競爭和遺留技術(shù)造成的無法解鎖數(shù)據(jù)孤島的問題以及不愿意讓企業(yè)處于任何風(fēng)險的立場。
Erskine說: "我們需要的是相當于USB的數(shù)據(jù) 端口。 但是現(xiàn)在, 我們無法介入醫(yī)療保健組織, 將算法應(yīng)用到標準化接口, 并確保無論何地它都能以同樣的方式工作?!?/p>
"部分原因是沒有通用的醫(yī)療數(shù)據(jù)模型;另外部分原因是我們的醫(yī)療 IT 系統(tǒng)是事務(wù)性的。 但是, 如果我們能夠建立標準化并鎖定數(shù)據(jù)的安全使其泄露的風(fēng)險比現(xiàn)在還低, 那么我們就可以在突飛猛進的基礎(chǔ)上取得進展?!?/p>
不過, MacRae認為問題不能完全歸咎于繁瑣的技術(shù)或過時的法規(guī)。 醫(yī)療行業(yè)本身的態(tài)度也難辭其咎。
他說: "阻止醫(yī)療以外的技術(shù)、方法和想法確實消耗了我們精力。我認為我們這樣做的部分原因是我們保守, 一部分是因為我們害怕, 還有部分原因是是風(fēng)險是確實很高?!?但我們必須盡快擺脫這種心態(tài), 否則我們將在23世紀繼續(xù)使用18世紀的醫(yī)療體系?!?我認為, 醫(yī)生的核心專業(yè)任務(wù)之一是以負責(zé)任和真正有利于患者的方式來構(gòu)建醫(yī)療系統(tǒng)。 如果我們不能做到, 我們就會違背我們對醫(yī)療應(yīng)該如何發(fā)展的長期愿景。
如何衡量AI在醫(yī)學(xué)上的的成功
AI可能非常善于識別癌癥或辨別高?;颊? 但它不一定能決定人類是如何定義AI的成功。投資的經(jīng)濟回報可能是其中的一部分; 臨床診斷質(zhì)量的改善可能是另一個部分。但醫(yī)療服務(wù)提供商的真正衡量標準是, AI是否能幫助他們更好地告知患者個人患病風(fēng)險, 更早地掌握發(fā)展狀況, 并增強消費者為自己的個人健康做出正確選擇的能力。
Erskine說: "我期待有有證可依的 ' 容易按鈕 '。 "當患者到醫(yī)院時, 我希望能夠按下這個按鈕, 在我的數(shù)據(jù)倉庫里找到一個與他們情況一樣的案例?!?/p>
"作為一名臨床醫(yī)生, 有時我認為我是根據(jù)自己的直覺來做決定的: 因為沒有直接證據(jù)。但事實是, 證據(jù)確實存在, 因為我不能憑空想象。 證據(jù)存在我大腦數(shù)據(jù)庫的某個地方, 我只是不能在診斷期間這么短時間內(nèi)找到它。AI可以幫我做到這一點?!?/p>
Lehman對AI成功的定義與Erskine的相似。 缺乏教育和意識是乳腺癌患者最大的敵人之一, 但AI能幫助她贏得這場戰(zhàn)斗。
她說: "無論我在什么診所工作, 當我們告訴女性她們得了乳腺癌時, 她們覺得非常驚訝,因為她們的家族沒有這樣的病史, 飲食健康,堅持鍛煉。 而這種情況發(fā)生在風(fēng)險非常高的女性身上時已是那晚期, 其中一些癌癥細胞已經(jīng)轉(zhuǎn)移。但我最常得到的答案是 ' 我就是不知道‘ 。"
“今年,我們要改變這種現(xiàn)狀; 我們可以開始使用AI, 以前所未有的準確度告知女性她們的風(fēng)險。 我們要擺脫那種 ' 我不知道;我從來沒有聽說過“的感覺。 我們將拯救生命?!斑@是AI對醫(yī)療領(lǐng)域的承諾, 并且是可以用我們今天擁有的技術(shù)和數(shù)據(jù)來實現(xiàn)。