百度釋出新AI算法 可提升腫瘤辨識效率與正確性
百度硅谷AI Lab發(fā)表新的深度學(xué)習(xí)算法NCRF(Neural CondiTIonal Random Field),據(jù)稱可改善目前活體組織切片檢查WSI(Whole Slide Image)分析的結(jié)果,協(xié)助病理學(xué)家提升腫瘤辨識效率與正確性。百度并以開源方式,在GitHub釋出該算法。
據(jù)報導(dǎo),WSI是數(shù)GB大的影像檔,通常包含數(shù)十億畫素(pixel),病理學(xué)家必須仔細(xì)檢視病理切片影像尋找腫瘤細(xì)胞,但微轉(zhuǎn)移(micrometastases)的小群腫瘤細(xì)胞直徑可小到1,000畫素,因此要從巨大的病理切片影像中有效分析辨識猶如大海撈針。即使運用深度學(xué)習(xí)算法,也僅能檢驗WSI影像的一部分。
目前許多WSI的深度學(xué)習(xí)算法,選擇將影像分割為如256x256畫素較小的尺寸獨立進(jìn)行分析,但腫瘤周圍特別是腫瘤與正常細(xì)胞交界處的影像會影響預(yù)測結(jié)果,由于這些算法的深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)無法將周圍的影像一并納入分析,反而增加從分割影像預(yù)測腫瘤的難度,經(jīng)常導(dǎo)致偽陽性誤判。
百度的NCRF算法運用CRF建立分割后相鄰影像之間空間相關(guān)性(spaTIal correlaTIon)模型,不需經(jīng)過前置或后續(xù)處理,即可以標(biāo)準(zhǔn)back-propagaTIon算法進(jìn)行端對端訓(xùn)練。CNN會從影像擷取特征,然后運用機(jī)率圖形模式(probabilistic graphical model)聚合相鄰影像的信息納入分析,因此能改善腫瘤預(yù)測、減少偽陽性誤判。
以Camelyon16資料集(dataset)測試百度的NCRF算法,腫瘤定位準(zhǔn)確度(FROC)平均分?jǐn)?shù)可達(dá)0.8096,優(yōu)于專業(yè)病理學(xué)家的0.7240與Camelyon16挑戰(zhàn)賽的前記錄0.8074。不過百度研究人員認(rèn)為,NCRF最合適的應(yīng)用方式還是做為人類專家的輔助工具,讓病理學(xué)家有更多時間專注于算法標(biāo)記出的腫瘤區(qū)域。
NCRF算法為通用技術(shù),但受限于訓(xùn)練用資料集的數(shù)量與規(guī)模,目前主要使用乳癌的公共資料,百度希望大陸醫(yī)院能提供更多更大型的資料集,進(jìn)行近一步的臨床研究,以徹底評估算法,并驗證在其它類型腫瘤的應(yīng)用。然而要將NCRF算法集成至現(xiàn)有病理切片分析儀器需要配套法規(guī),但目前尚缺具體指導(dǎo)原則,實際應(yīng)用于臨床病例還要一段時間。