癌癥突變檢測的新標(biāo)桿 承啟生物自研算法大幅領(lǐng)先國外算法
深圳2022年12月30日 /美通社/ -- 近日,暨南大學(xué)、華南理工大學(xué)團(tuán)隊(duì)發(fā)表論文Towards an accurate and robust analysis pipeline for somatic mutation calling,比較了突變檢測算法在癌癥領(lǐng)域常見的低頻突變標(biāo)準(zhǔn)測試數(shù)據(jù)集上的性能,發(fā)現(xiàn)國產(chǎn)FANSe算法的檢測效果遠(yuǎn)勝于國際上常用的算法,速度還要快上幾十倍。這將為癌癥診療等應(yīng)用提供重要的標(biāo)準(zhǔn)化依據(jù)。
癌癥的診斷、分型、治療中,突變檢測是重要手段。特定的突變對(duì)應(yīng)著相應(yīng)的治療方案,尤其是近年來火爆的靶向治療和免疫治療,均高度依賴突變檢測的結(jié)果。因此突變檢測的靈敏度和準(zhǔn)確性在癌癥的診療中十分關(guān)鍵。用二代測序手段進(jìn)行全基因組級(jí)別的突變檢測一直被視為癌癥診療的“通用武器”,但市場上的現(xiàn)實(shí)狀況卻是亂象不止。不少人都有過體會(huì),將同一份樣品送到兩家公司去進(jìn)行檢測,得到的兩份突變檢測報(bào)告卻大相徑庭。事實(shí)上,這是一個(gè)國際性的難題。2017年,JAMA Oncology雜志發(fā)表研究,將40個(gè)患者的ctDNA樣品送至兩家國際知名的測序公司,大部分患者得到的兩份突變檢測報(bào)告中的突變完全不同。醫(yī)生很難從這樣兩份充滿著矛盾和沖突的報(bào)告中制定正確的治療方案,看似“先進(jìn)”的二代測序技術(shù)卻往往帶來悲劇。在實(shí)驗(yàn)和儀器早已高度標(biāo)準(zhǔn)化的情況下,主要的問題在于算法的準(zhǔn)確性。使用標(biāo)準(zhǔn)樣品進(jìn)行的室間質(zhì)評(píng)一直是監(jiān)管部門使用的質(zhì)控方法,但對(duì)基因組級(jí)別的檢測,標(biāo)準(zhǔn)樣品難以制備:人工方法做幾個(gè)突變出來還可以,但整個(gè)基因組的突變狀況要想給出可靠的標(biāo)準(zhǔn)答案非常難以做到。也因此,長期以來整個(gè)市場無法得到有效監(jiān)管。
2020年,華南理工大學(xué)杜紅麗教授團(tuán)隊(duì)使用多個(gè)真實(shí)世界的測序數(shù)據(jù)集,制作了一系列基因組級(jí)別的低頻突變標(biāo)準(zhǔn)測試數(shù)據(jù)集,這是世界上第一個(gè)接近真實(shí)癌癥測序應(yīng)用場景、并有明確“標(biāo)準(zhǔn)答案”的突變檢測評(píng)測數(shù)據(jù)集,可以客觀真實(shí)地反映突變檢測流程的能力。此次研究中,研究者們利用這一系列標(biāo)準(zhǔn)測試數(shù)據(jù)集評(píng)測了5種突變檢測流程,包括唯一的純國產(chǎn)自主開發(fā)的FANSe流程和國際上的4種主流突變檢測算法。測試結(jié)果顯示,所有算法能檢出的突變基本99%以上都是正確的,即“假陽性”較少,但靈敏度則有巨大的差異。在所有場景下(突變頻率1-40%,測序深度100-800x),F(xiàn)ANSe的靈敏度都顯著超越其他所有算法,即FANSe能檢出更多的突變,同時(shí)保持很高的準(zhǔn)確度。即便是1%突變率下,F(xiàn)ANSe也可以正確檢出87%的突變,而此時(shí)Mutect2和Strelka2僅能檢出20%左右的突變。突變率5%時(shí),F(xiàn)ANSe即可幾乎完美地檢出所有的突變。速度方面更是一騎絕塵,無論是序列比對(duì)(mapping)過程還是突變檢測過程,均比其他流程快上數(shù)量級(jí)。
FANSe算法由承啟首席科學(xué)家張弓教授開發(fā),最初是專門用于大規(guī)模測序的序列比對(duì),其準(zhǔn)確度有數(shù)學(xué)證明,并已基本達(dá)到理論上限。隨后逐漸擴(kuò)展其應(yīng)用領(lǐng)域,目前已直接整合了快速的突變檢測和表達(dá)量檢測等常用分析,部署于承啟生物的云平臺(tái)上。2020年,承啟生物云平臺(tái)創(chuàng)造了單機(jī)5分鐘分析完成一個(gè)人全基因組測序數(shù)據(jù)集的世界紀(jì)錄并保持至今,用戶不再需要自己購買昂貴的服務(wù)器,只需要上傳數(shù)據(jù)即可享受免費(fèi)、快速準(zhǔn)確的基因測序分析服務(wù)。2022年,以FANSe為基礎(chǔ)的大規(guī)模測序云分析系統(tǒng)在AWS上部署成功,全世界的用戶都可以在數(shù)據(jù)不出境的前提下使用FANSe快速準(zhǔn)確的分析。FANSe極高的效率也使得其成為唯一一種在純國產(chǎn)CPU上能達(dá)到應(yīng)用上可接受的速度的分析流程,使得基因測序的全流程完全脫離國外技術(shù),徹底避免“卡脖子”,保障中國精準(zhǔn)醫(yī)學(xué)的安全。
此次FANSe被確認(rèn)可以準(zhǔn)確全面地檢測癌癥突變,將為癌癥診療等應(yīng)用提供重要的標(biāo)準(zhǔn)化依據(jù),也為行業(yè)樹立了一個(gè)新的標(biāo)桿。