某些生物醫(yī)藥領(lǐng)域使用人工智能技術(shù)或?qū)⒌贸鲆恍┎粶?zhǔn)確的結(jié)論
掃描二維碼
隨時(shí)隨地手機(jī)看文章
北京時(shí)間2月18日早間消息,據(jù)報(bào)道,一組頂尖科學(xué)家和醫(yī)學(xué)統(tǒng)計(jì)學(xué)家上周五警告稱,在某些生物醫(yī)藥領(lǐng)域使用人工智能技術(shù)會(huì)得出一些不準(zhǔn)確的結(jié)論。
“使用機(jī)器學(xué)習(xí)技術(shù)對(duì)大數(shù)據(jù)進(jìn)行分析得出的研究結(jié)論中,有很多都無法獲得我的信任?!泵绹R斯大學(xué)貝勒醫(yī)學(xué)院副教授基尼維拉·艾倫(Genevera Allen)在美國科學(xué)促進(jìn)會(huì)年會(huì)上警告說。
機(jī)器學(xué)習(xí)已經(jīng)被用于研究科學(xué)和醫(yī)學(xué)數(shù)據(jù)與某些現(xiàn)象之間的關(guān)系,例如基因與疾病之間的關(guān)聯(lián)性。在精準(zhǔn)醫(yī)療中,研究人員會(huì)尋找擁有相似DNA的病人,讓治療方案能夠瞄準(zhǔn)特定的致病基因。
“很多技術(shù)都是為了進(jìn)行預(yù)測?!卑瑐愓f,“但從來沒有返回過‘我不知道’或者‘我沒有發(fā)現(xiàn)任何東西’這樣的結(jié)論,因?yàn)樗鼈冊O(shè)計(jì)過程中就沒有考慮這種情況?!?/p>
她不太愿意指出具體的案例,但卻表示,機(jī)器學(xué)習(xí)對(duì)癌癥數(shù)據(jù)得出的研究結(jié)論就是很好的例子。
“有很多案例都無法重復(fù)。”艾倫說,“一項(xiàng)研究中發(fā)現(xiàn)的集群跟另外一項(xiàng)研究中發(fā)現(xiàn)的截然不同。為什么會(huì)出現(xiàn)這種情況?因?yàn)楫?dāng)今的多數(shù)機(jī)器學(xué)習(xí)技術(shù)都會(huì)說:‘我發(fā)現(xiàn)了一個(gè)群體?!械臅r(shí)候,如果換一種說法反而更有幫助,可以說:‘我認(rèn)為其中一些確實(shí)是被分成一組,但我不確定另外一些?!?/p>
一旦機(jī)器學(xué)習(xí)發(fā)現(xiàn)病人基因與疾病特征之間存在特定聯(lián)系,人類研究人員可能就會(huì)對(duì)相應(yīng)的發(fā)現(xiàn)提供合理的科學(xué)解釋。但這并不意味著這些發(fā)現(xiàn)就是正確的。
艾倫說:“你總能找到理由來說明為什么某些基因被分成一組?!?/p>
計(jì)算機(jī)科學(xué)家直到最近才開始意識(shí)到這個(gè)問題,這可能導(dǎo)致醫(yī)學(xué)研究人員走上錯(cuò)誤的道路,還會(huì)浪費(fèi)資源來確認(rèn)無法重復(fù)的結(jié)果。
艾倫和她的同事正在努力改進(jìn)統(tǒng)計(jì)技術(shù)和機(jī)器學(xué)習(xí)技術(shù),好讓人工智能可以對(duì)自己的數(shù)據(jù)分析展開批判,并指出某些發(fā)現(xiàn)有多大概率是真實(shí)存在的,而非隨即相關(guān)的。
“有一種想法是專門擾亂數(shù)據(jù),看看結(jié)果是否會(huì)保持不變?!彼f。