承啟生物實(shí)現(xiàn)純國(guó)產(chǎn)硬件高性能分析大規(guī)?;驕y(cè)序數(shù)據(jù)
深圳2022年5月18日 /美通社/ -- 日前,承啟生物首次實(shí)現(xiàn)了在純國(guó)產(chǎn)電腦上使用自研FANSe算法高性能分析大規(guī)?;驕y(cè)序數(shù)據(jù),其速度與當(dāng)前基于主流Intel和AMD處理器的臺(tái)式機(jī)和服務(wù)器相當(dāng)。這實(shí)現(xiàn)了精準(zhǔn)醫(yī)學(xué)基因測(cè)序領(lǐng)域的純國(guó)產(chǎn)流程實(shí)用化,在這一領(lǐng)域中國(guó)徹底擺脫了"卡脖子"問(wèn)題。
大規(guī)模測(cè)序,又稱新一代測(cè)序、二代測(cè)序,將DNA或RNA打斷成許多小片段進(jìn)行平行測(cè)序,一次測(cè)序即可得到幾百萬(wàn)至幾億個(gè)小片段的核酸片段序列信息,在生物學(xué)研究、疾病診斷、流行病溯源等領(lǐng)域有著廣泛的應(yīng)用。但產(chǎn)生的海量數(shù)據(jù)必須經(jīng)過(guò)大量運(yùn)算才能得到有生物學(xué)意義的結(jié)論,通常這需要很強(qiáng)算力的計(jì)算機(jī)或服務(wù)器才能在數(shù)小時(shí)內(nèi)給出結(jié)果。
然而,高性能CPU和GPU高度依賴進(jìn)口,不但有被國(guó)外斷供"卡脖子"的危險(xiǎn),而且進(jìn)口CPU還可能存在后門,有泄密風(fēng)險(xiǎn)。在政府等對(duì)安全性要求極高的場(chǎng)合,以往一直沒(méi)有純國(guó)產(chǎn)計(jì)算機(jī)能滿足大規(guī)模測(cè)序的分析需求,這是由于國(guó)產(chǎn)CPU難以滿足需求。
承啟一直在生物信息國(guó)產(chǎn)化處理領(lǐng)域做努力,經(jīng)過(guò)深入調(diào)研發(fā)現(xiàn),兆芯開先CPU架構(gòu)的整數(shù)性能理論上比較優(yōu)秀,實(shí)際應(yīng)用時(shí)需要軟件的特定優(yōu)化才能發(fā)揮其全部性能潛力,因此選擇了兆芯開先CPU作為FANSe算法適配優(yōu)化的目標(biāo)。
承啟生物自研的FANSe算法是目前唯一規(guī)?;逃玫募儑?guó)產(chǎn)高性能大規(guī)模測(cè)序比對(duì)算法,2020年其曾創(chuàng)下單機(jī)5分鐘分析完一個(gè)30X人全基因組測(cè)序數(shù)據(jù)集的世界紀(jì)錄,并一直保持至今。算法完全自研帶來(lái)了顯著的優(yōu)勢(shì),可以任意根據(jù)CPU的特性而進(jìn)行特別優(yōu)化,而依賴于國(guó)外知識(shí)產(chǎn)權(quán)的傳統(tǒng)算法則難以做到。
承啟生物在純國(guó)產(chǎn)電腦上使用自研FANSe算法高性能分析大規(guī)模基因測(cè)序數(shù)據(jù)
日前,F(xiàn)ANSe算法在純國(guó)產(chǎn)平臺(tái)上運(yùn)行成功,CPU是兆芯開先KX-U6780A,固態(tài)硬盤來(lái)自長(zhǎng)江存儲(chǔ),內(nèi)存芯片來(lái)自長(zhǎng)鑫。與之對(duì)比的是一臺(tái)雙Intel E5V3 (共28核56線程)的服務(wù)器,都部署在承啟基因測(cè)序分析云平臺(tái)上。在常見(jiàn)的轉(zhuǎn)錄組、翻譯組、細(xì)菌菌群宏基因組等應(yīng)用中,純國(guó)產(chǎn)計(jì)算機(jī)的性能僅比服務(wù)器慢1%~12%,使用中幾乎感覺(jué)不到其性能差異。這也是純國(guó)產(chǎn)計(jì)算設(shè)備在大規(guī)模測(cè)序數(shù)據(jù)處理上第一次在實(shí)際應(yīng)用性能上幾乎追平國(guó)際主流服務(wù)器。
此前,承啟生物和華大智造聯(lián)合發(fā)布了國(guó)產(chǎn)大規(guī)模測(cè)序的全流程,將測(cè)序儀、試劑、分析算法等全面實(shí)現(xiàn)國(guó)產(chǎn)化,不依賴國(guó)外知識(shí)產(chǎn)權(quán),有力地捍衛(wèi)了中國(guó)精準(zhǔn)醫(yī)學(xué)的自主權(quán)。
如今,承啟再進(jìn)一步,憑借專門優(yōu)化的FANSe算法,將純國(guó)產(chǎn)計(jì)算設(shè)備的應(yīng)用性能提高到比肩國(guó)際主流的水平,標(biāo)志著中國(guó)的基因測(cè)序的安全性和自主可控達(dá)到一個(gè)全新的高度,不僅能支撐諸多精準(zhǔn)醫(yī)學(xué)應(yīng)用,更能在檢驗(yàn)檢疫、流行病控制、生物戰(zhàn)防治、法醫(yī)鑒定等直接關(guān)系到國(guó)家安全的方面大顯身手。