揭秘GPU在生物科學(xué)方面的應(yīng)用
隨著科學(xué)技術(shù)的快速發(fā)展,人類在生命科學(xué)中不斷研究和探索,從分子結(jié)構(gòu)到原子結(jié)構(gòu),再到納米結(jié)構(gòu)。為了更加了解生命過程中細(xì)胞的物理過程,我們的手段從傳統(tǒng)的顯微鏡,到電子顯微鏡,再到現(xiàn)在的計(jì)算顯微鏡,以方便人類更加直觀地觀察和模擬細(xì)胞的物理過程。基于強(qiáng)大的計(jì)算能力之上的計(jì)算生物科學(xué),將給我們帶來生命科學(xué)的新契機(jī)。
目前,顯微鏡被廣泛應(yīng)用到生物科學(xué)中,科學(xué)家利用計(jì)算顯微鏡來觀察生物細(xì)胞,模擬細(xì)胞的物理化學(xué)過程。這需要具備強(qiáng)大并行計(jì)算能力的計(jì)算機(jī)輔助,因此,計(jì)算機(jī)的并行計(jì)算能力直接影響了生物科學(xué)中的研究能力。目前,GPU被廣泛應(yīng)用到各行各業(yè)中,這也包括生物科學(xué)研究領(lǐng)域。
模擬病毒感染的過程
1.模擬脊髓灰質(zhì)炎病毒感染過程(Polioriurs infection)
脊髓灰質(zhì)炎病毒(Poliovirus,或稱為脊髓灰白質(zhì)炎病毒)是脊髓灰質(zhì)炎(小兒麻痹)的病原,又稱小兒麻痹病毒,是一個(gè)沒有外殼的病毒,由一條單股RNA組成。人類和猴子都容易受這種病毒的感染。病毒在感染后的細(xì)胞內(nèi)復(fù)制成熟后,就會(huì)在短期內(nèi)一次釋放大量的病毒,使得被感染的細(xì)胞死亡,釋放出來的病毒又會(huì)感染其他細(xì)胞,又開始新一輪的感染周期,直到所有容易感染的細(xì)胞都被感染并死亡。如果要弄清楚整個(gè)復(fù)雜的物理過程,就需要構(gòu)建一億量級的單位物理模型,并經(jīng)過長時(shí)間的模擬運(yùn)行,才能真正得到這個(gè)物理過程。這個(gè)模擬過程的計(jì)算量是大得驚人的,無疑這適合并行計(jì)算能力強(qiáng)大的GPU去運(yùn)行。
2.病毒衣殼力學(xué)
乙型肝炎病毒(Hepatitis B virus)又被稱作乙肝病毒(HBV),屬于DNA病毒。就目前科學(xué)研究的成果來看,HBV只對人類和猩猩有易感性,容易引發(fā)乙型病毒性肝炎疾病。完整的乙肝病毒成顆粒狀,分為外殼和核心兩部分,直徑約為42納米?;疑庑螢椴捎迷恿︼@微鏡得到的物理實(shí)驗(yàn)結(jié)果,綠色圓形為計(jì)算機(jī)模擬下的結(jié)果。這里通過計(jì)算機(jī)模擬的方式得到的結(jié)果幾乎和原子力顯微鏡實(shí)驗(yàn)中得到的結(jié)果完全吻合。在這種情況下就可以通過模擬的方式對病毒進(jìn)行分析,從而更加清晰地了解整個(gè)病毒物理作用的過程。采用GPU加速的模擬過程可以提高25.5倍的速度,可以節(jié)省10倍的能源。
光合作用過程
這里展示的紫色光合作用細(xì)菌,原理是光轉(zhuǎn)化為電,ADP(二磷酸腺苷)轉(zhuǎn)化為ATP(三磷酸腺苷)。需要采用靜電場計(jì)算并且使用多級求和法,這要求具備千萬量級計(jì)算能力的單位進(jìn)行模擬,需要進(jìn)行大規(guī)模并行計(jì)算,原子越多,模擬的過程和時(shí)間越長。在目前主流的CPU上計(jì)算大約需要1小時(shí)10分鐘。而如果利用具備并行處理計(jì)算能力強(qiáng)悍的GPU進(jìn)行運(yùn)算的話,時(shí)間會(huì)大大縮小。而且整個(gè)三維模型可以很好地跟GPU的三維架構(gòu)的線程模型進(jìn)行匹配,能最大限度利用GPU計(jì)算的能力。采用基于G80架構(gòu)的3塊GPU就可以在大約90秒鐘內(nèi)模擬完成,并可以達(dá)到擁有線性時(shí)間復(fù)雜度,且比其他方法的有更高的靈活性。利用GPU進(jìn)行運(yùn)算的話,效率會(huì)大大提升。
通過基因藍(lán)圖制造蛋白質(zhì)
制造過程
科學(xué)家通過核糖體從mRNA中解碼基因信息并產(chǎn)生出新的蛋白質(zhì),這是蛋白質(zhì)的制造過程。實(shí)現(xiàn)這個(gè)過程也是研究抗生素的重要目標(biāo)。其中重要的環(huán)節(jié)就是弄清楚核糖體的結(jié)構(gòu),模擬整個(gè)制造過程。2009年的諾貝爾化學(xué)獎(jiǎng)就給了揭開蛋白質(zhì)制造過程的三位科學(xué)家。這樣的生物物理過程的研究可以比喻成足球比賽,期望的不只是足球比賽的結(jié)果,而是整個(gè)足球比賽的過程。了解生物的物理過程才能更好地了解其中的物理原因,找到問題的根本。傳統(tǒng)的低分辨率的圖像只能得到足球比賽的結(jié)果,而不知道比賽的過程。對于現(xiàn)在基于高性能計(jì)算的高分辨率結(jié)構(gòu)圖,可以清晰地看到新生的蛋白質(zhì)。
分子動(dòng)力學(xué)模擬
通過分子動(dòng)力學(xué)的方式可以模擬整個(gè)新蛋白產(chǎn)生的過程,具體方法是使用計(jì)算機(jī)來模擬蛋白質(zhì)產(chǎn)生的過程,這差不多需要模擬100萬個(gè)單元??梢钥吹较聢D,隨著GPU數(shù)量的逐漸增多,單步的模擬過程時(shí)間越來越短,可以達(dá)到很高的性能。通過GPU的加速,整個(gè)模擬的過程從以前的兩個(gè)月縮短到了兩周。隨著GPU數(shù)量的逐漸增多,計(jì)算機(jī)的性能也越來越強(qiáng)。
納米孔傳感器
新型納米孔是通過電力場作用驅(qū)動(dòng)單個(gè)分子逐一通過納米孔來實(shí)現(xiàn)測序的。由于納米孔的直徑非常細(xì)小,可以偵測通過的單個(gè)核酸聚合物,能保持良好的持續(xù)性和高精度地測量基因信息。對于長達(dá)1000個(gè)堿基的單鏈DNA分子、RNA分子或者更短的核酸分子而言,也并不需要進(jìn)行擴(kuò)增或標(biāo)記就可以直接使用納米孔來進(jìn)行測試,這使得快速地進(jìn)行DNA測序成為可能。
對于基因的了解,通常情況下大家知道A、T、G、C四種堿基,其實(shí)還有第五種堿基——甲基化胞嘧啶。單分子納米孔測序儀能直接分辨出未修飾的胞嘧啶和甲基化胞嘧啶。當(dāng)單鏈DNA通過納米孔的時(shí)候,單個(gè)堿基落入孔中,它們跟納米孔內(nèi)特定物質(zhì)相互作用,阻礙了穿過孔中的電流同道。A、T、C、G以及甲基胞嘧啶都會(huì)有自己特有的電流振幅,因此很容易把這些電流振幅轉(zhuǎn)化成DNA序列。這樣就可以通過納米孔技術(shù)就能直接讀出這第五種堿基。
但是現(xiàn)在的納米孔材料還有很多問題需要解決,例如可以通過模擬的方式來選擇生產(chǎn)更好的高分子納米材料。但現(xiàn)在還沒有一種生物納米孔或者人工合成的納米孔能有一個(gè)非常合適的幾何結(jié)構(gòu),并通過模擬的方式分析合成出適合的高分子材料,在這個(gè)過程中通常采用徑向分布函數(shù)的方法來進(jìn)行分析沉淀物和流體的情況。下圖模擬了4700萬個(gè)單元,如果利用4核心的英特爾Xeon X5550 CPU,需要15個(gè)小時(shí),如果利用4臺(tái)NVIDIA的Tesla C2050 GPU,只需要10分鐘就可以完成。這里還有一個(gè)數(shù)據(jù),利用Fermi架構(gòu)的GPU的性能是采用上一代GT200架構(gòu)GPU性能的3倍以上。