信息技術跑出加速度
如果我們將大數(shù)據(jù)、人工智能算法、算力運用到藥理毒理研究、蛋白篩選、新藥研發(fā)中,就能夠大幅加快老藥新指征與疫苗的研制進程。例如,在2015 年抗擊埃博拉病毒的新藥研制中,Atomwise公司準備了埃博拉病毒入侵生物細胞的“爪”的模型,利用類似人腦神經(jīng)的網(wǎng)絡進行藥物成分分析,檢測已知的7000種可對抗這種“爪”的藥物,用不到一天的時間就在7000種藥物中成功找到能控制埃博拉病毒的兩種候選藥物,且成本不超過 1000 美元。如果利用傳統(tǒng)的方法進行分析篩選,需要數(shù)月甚至是數(shù)年。
新冠肺炎可能成為百年不遇的大流行病,其傳播速度和嚴重程度與1918年的流感疫情不相上下。全球需要加快針對新冠肺炎的療法研究和疫苗開發(fā)工作。目前利用已通過安全性測試的化合物庫和新的篩選技術(包括機器學習),科學家們能夠在幾周內(nèi)篩選出可用于大規(guī)模臨床試驗的抗病毒藥物,從而加快藥物研發(fā)進程。日前,英特爾、聯(lián)想以及華大基因宣布,三家公司正攜手加快新型冠狀病毒的基因組特性分析。利用聯(lián)想超算技術和基因組分析工具,可為全基因組測序和全外顯子測序的計算提供高達40倍的加速,幫助華大基因高效處理數(shù)據(jù),更快地生成可靠的基因組分析成果,從而縮短科研和臨床觀察的時間。
在基因測序工作中,每毫升體液通常會包含數(shù)百萬個不同的病毒體,而每個病毒體的基因組則包含大約30000個DNA堿基或字母。華大基因正在對許多感染患者和疑似感染患者的微生物進行基因測序,而這些研究工作將會生成TB級乃至PB級的海量數(shù)據(jù)。要想高效快速地處理這些重要數(shù)據(jù),就需要采用更為先進的高性能計算(HPC)基礎架構、計算技術以及優(yōu)化的基因組分析方法。
尋找疫苗和救治方法,在這場科學與病毒的賽跑中,目前許多的信息技術公司正與不同的科學家團隊展開合作,為他們的研發(fā)提供算力、算法工具,助其快馬加鞭。例如,阿里云提供超大規(guī)模計算力、人工智能算法等技術,支持鐘南山院士團隊的科研人員加快開展對新冠病毒的新藥研發(fā)、病毒基因測序、蛋白篩選等相關工作,縮短攻關周期。