人工智能從來沒有像現(xiàn)在這么重要過!
這段時間的疫情猛烈,AI每一次在醫(yī)療領(lǐng)域的落地都在幫助白衣天使拯救生命。從疫情預(yù)測到檢測體溫再到藥物開發(fā),人工智能爭分奪秒,蓄勢待發(fā)。
更為準(zhǔn)確的說是醫(yī)療AI公司們站了出來,為醫(yī)護人員鑄造了一面堅強的后盾。
1月28日,依圖醫(yī)療的第一版新冠肺炎產(chǎn)品在上海公衛(wèi)上線,2月5日在武漢的協(xié)和醫(yī)院、中南醫(yī)院、武漢大學(xué)人民醫(yī)院以及荊州市第一人民醫(yī)院完成部署。
1月31日,推想科技宣布推出針對新冠肺炎篩查產(chǎn)品。
2月15日,阿里巴巴宣布:達摩院聯(lián)合阿里云針對新冠肺炎臨床診斷研發(fā)了一套全新AI診斷技術(shù),AI可以在20秒內(nèi)準(zhǔn)確地對新冠疑似案例CT影像做出判讀,分析結(jié)果準(zhǔn)確率達到96%。
。。.。 。。.
相對于巡邏機器人的檢測體溫,CT影像的自動檢測才能代表AI在醫(yī)療領(lǐng)域的最高水準(zhǔn),但也更難大規(guī)模應(yīng)用,這里面不僅包含算法難關(guān),更存在著不斷迭代的需求。
但此技術(shù)又不得不加緊落地!因為在2月5日,國家衛(wèi)健委發(fā)文表示:在湖北省內(nèi),CT影像結(jié)果要作為新型冠狀病毒感染“臨床診斷病例”的判定依據(jù)。
那么AI技術(shù)在從算法到應(yīng)用層面有哪些難點呢?
具體算法,遍地開花
在2017年春節(jié)期間,斯坦福大學(xué)工程學(xué)院和醫(yī)學(xué)院合作團隊在《自然》上發(fā)布了在皮膚癌診斷領(lǐng)域的最新突破。他們在谷歌用于識別貓和狗算法的基礎(chǔ)上,經(jīng)過13萬張皮膚病變的圖像訓(xùn)練后,開發(fā)出了可用于識別皮膚癌的AI系統(tǒng)。
吳恩達教授也在2017年發(fā)表相關(guān)研究,其使用CheXNet算法訓(xùn)練的模型可以診斷14種病癥,尤其在肺炎診斷方面,比放射科專家單獨診斷的準(zhǔn)確率更高。
2018年Google的Gulshan團隊采用近13萬張已由54位美國專家標(biāo)注過的視網(wǎng)膜眼底圖像,對深度學(xué)習(xí)網(wǎng)絡(luò)進行訓(xùn)練,檢測準(zhǔn)確率達到曲線下面積91%。
同年, 國家千人計劃“入選者張康教授率領(lǐng)中國研究團隊在頂級期刊《細胞》上發(fā)表了一篇AI在醫(yī)療領(lǐng)域應(yīng)用,即基于深度學(xué)習(xí)開發(fā)出一個能診斷眼病和肺炎兩大類疾病的AI系統(tǒng),就準(zhǔn)確性來說能夠匹敵頂尖醫(yī)生。
值得一提的是,張康教授的那項研究也是世界范圍內(nèi)首次使用龐大的標(biāo)注好的高質(zhì)量數(shù)據(jù)進行遷移學(xué)習(xí)。
遷移學(xué)習(xí)可以解決訓(xùn)練數(shù)據(jù)不足的局限。
那么這么多突破性的研究,這么多表現(xiàn)良好的算法模型為什么卻在實際應(yīng)用效果不佳呢。
首先在胸片上發(fā)現(xiàn)肺炎非常困難,即使對放射科醫(yī)師來說,他們眼中的胸透圖像的肺炎特征也是模糊的,容易和許多其他的良性異常相混淆。
也就是說人工智能系統(tǒng)對肺部CT影像的片狀陰影不夠敏感,而片狀陰影是新型冠狀病毒肺炎的主要病灶。
而要想要鑒別新冠肺炎影像與普通病毒性肺炎影像也并不容易,臨床上影像科的醫(yī)生有自己的判別標(biāo)準(zhǔn),擁有這個標(biāo)準(zhǔn)的開發(fā)人員會嘗試不同的方法提升自己的模型,但是一些算法的訓(xùn)練研究員并不具有放射科的背景,另外這個標(biāo)準(zhǔn)也并不是容易量化。
對于訓(xùn)練數(shù)據(jù)來說,數(shù)據(jù)量的多少不是關(guān)鍵,關(guān)鍵的是有代表性的以及疑難的數(shù)據(jù)有多少,一個基于學(xué)習(xí)而不是規(guī)則的算法本身需要大量的類似數(shù)據(jù)才能學(xué)習(xí)到正確的知識。在AI在檢測新冠狀肺炎肺炎的時候,由于缺少“疑難雜癥”樣本數(shù)據(jù),即使識別了99%的病人,但是可能真正有威脅的是那沒有識別出了1%。
目前深度學(xué)習(xí)訓(xùn)練過程中所采用的解釋性的方法基本都是可視化方法,看哪些部位對患病概率的貢獻比較大,而這個概率只根據(jù)CT影像獲得的。但是醫(yī)生在具體判斷時候,還要結(jié)合病史,遺傳,生活習(xí)慣等等做出推斷。
再有,如果疾病發(fā)生新的變異或變化,那么原來的算法模型還能使用么?
考慮到實際情況,各地的CT設(shè)備并不是非常統(tǒng)一,也就是說對原算法模型的驗證效果很難都達標(biāo),甚至可能非常低。即使在原模型基礎(chǔ)上進行微調(diào),也可能需要某個型號的CT設(shè)備提供的非常多的數(shù)據(jù)。各地的檢測環(huán)境也不是非常統(tǒng)一,最差的情況可能會需要對每一臺機器進行微調(diào)來保證準(zhǔn)確率,但這樣特殊的數(shù)據(jù)真的很好采集嗎?