"算儲(chǔ)兼?zhèn)? 亞馬遜云科技可滿足醫(yī)療與生命科學(xué)行業(yè)的存儲(chǔ)需求
北京2023年8月18日 /美通社/ -- 早在16世紀(jì),近代人體解剖學(xué)創(chuàng)始人安德烈·維薩里在其著作《人體結(jié)構(gòu)》中首次描述了人體的骨骼、肌肉、血管和神經(jīng)的自然形態(tài)和分布。這一偉大成果使維薩里成為與哥白尼并列的兩大科學(xué)革命代表人物,也讓醫(yī)學(xué)和人體生物學(xué)從此擺脫中世紀(jì)神權(quán)桎梏,步入科學(xué)軌道。
以此為起點(diǎn),醫(yī)學(xué)研究一路向著更微觀的世界挺近,在歷經(jīng)發(fā)明顯微鏡,發(fā)現(xiàn)細(xì)菌,發(fā)現(xiàn)抗生素等數(shù)個(gè)里程碑之后,來(lái)到了以基因圖譜和分子式為研究對(duì)象,將人工智能(AI)和機(jī)器學(xué)習(xí)(ML)作為研究工具的精準(zhǔn)醫(yī)學(xué)時(shí)代。
相比于維薩里要靠盜尸來(lái)獲得研究"數(shù)據(jù)"的窘境,如今已游走于分子維度的精準(zhǔn)醫(yī)學(xué)卻要應(yīng)對(duì)數(shù)據(jù)爆炸帶來(lái)的難題。身處分秒不停的數(shù)據(jù)洪流之中,醫(yī)療與生命科學(xué)行業(yè)對(duì)IT基礎(chǔ)設(shè)施的核心需求之一就是以較低成本獲得龐大且可彈性擴(kuò)縮的存儲(chǔ)空間。這種需求也開啟了醫(yī)療與生命科學(xué)行業(yè)數(shù)據(jù)的上云之旅。
亞馬遜云科技基于醫(yī)療與生命科學(xué)行業(yè)客戶的需求不斷創(chuàng)新,不但讓他們獲得云上高性價(jià)比的彈性存儲(chǔ)空間,并針對(duì)存儲(chǔ)服務(wù)不斷創(chuàng)新以支持他們大規(guī)模的數(shù)據(jù)計(jì)算,達(dá)成"存"與"用"的性能協(xié)同。
如何滿足醫(yī)療與生命科學(xué)行業(yè)海量數(shù)據(jù)的存儲(chǔ)需求,并降低存儲(chǔ)成本?
數(shù)據(jù)量的爆炸性增長(zhǎng)在醫(yī)療與生命科學(xué)領(lǐng)域尤為顯著。例如在藥物發(fā)現(xiàn)領(lǐng)域,科學(xué)家已發(fā)現(xiàn)的自然界里有可能成為藥物分子的個(gè)數(shù)有1060之多,相比之下,整個(gè)太陽(yáng)系原子個(gè)數(shù)也只是1050左右。即便是數(shù)據(jù)指數(shù)效應(yīng)相對(duì)較弱的醫(yī)院和診所,在國(guó)內(nèi)也面對(duì)一年數(shù)十億人次診療所沉積的數(shù)字化檔案及醫(yī)學(xué)影像。
如何存儲(chǔ)海量數(shù)據(jù)并不斷降低存儲(chǔ)成本是醫(yī)療和生命科學(xué)領(lǐng)域亟需解決的一大挑戰(zhàn)。而無(wú)論從可靠性還是經(jīng)濟(jì)性,亞馬遜云科技的存儲(chǔ)服務(wù)都為醫(yī)療和生命科學(xué)機(jī)構(gòu)存放海量數(shù)據(jù)提供了可靠的選擇。
其中,對(duì)象存儲(chǔ)服務(wù)Amazon Simple Storage Service (Amazon S3)設(shè)計(jì)具有99.999999999%(11個(gè)9)的持久性,具有安全、可擴(kuò)展和按需付費(fèi)等特性,可輕松完成PB至EB級(jí)數(shù)據(jù)的存儲(chǔ)。為了更經(jīng)濟(jì)、高效地存儲(chǔ)客戶的數(shù)據(jù),亞馬遜云科技持續(xù)對(duì) Amazon S3進(jìn)行創(chuàng)新。例如,Amazon S3的存儲(chǔ)層級(jí)多達(dá)8級(jí),讓客戶可根據(jù)工作負(fù)載對(duì)數(shù)據(jù)訪問(wèn)、恢復(fù)能力和成本等方面的需求來(lái)進(jìn)行選擇;Amazon S3智能分層( Intelligent-Tiering )在不影響性能的前提下,能夠在數(shù)據(jù)訪問(wèn)模式發(fā)生變化時(shí)自動(dòng)節(jié)省存儲(chǔ)成本。自2018年推出 Amazon S3 Intelligent-Tiering 以來(lái),客戶使用該功能已經(jīng)節(jié)省了 10 億美元。
醫(yī)療與生命科學(xué)行業(yè)大規(guī)模、高并發(fā)的數(shù)據(jù)計(jì)算需要高性能的存儲(chǔ)服務(wù)
海量數(shù)據(jù)為基因診斷、基因治療、靶向藥物研發(fā)等奠定了精準(zhǔn)醫(yī)學(xué)發(fā)展的基礎(chǔ),而大規(guī)模的數(shù)據(jù)計(jì)算則推進(jìn)精準(zhǔn)醫(yī)學(xué)的發(fā)展。例如單次數(shù)據(jù)分析所涉及的樣本數(shù)量可能超過(guò)數(shù)萬(wàn)或數(shù)十萬(wàn),可能需調(diào)用底層成百上千甚至上萬(wàn)個(gè)計(jì)算實(shí)例,這對(duì)存儲(chǔ)數(shù)據(jù)的存儲(chǔ)服務(wù)提出更高的數(shù)據(jù)吞吐性能要求。
為了確保存儲(chǔ)服務(wù)性能足以支持大規(guī)模、高并發(fā)計(jì)算集群的要求,亞馬遜云科技提供了一項(xiàng)完全托管式的文件存儲(chǔ)服務(wù)Amazon FSx for Lustre,為高性能計(jì)算工作負(fù)載提供經(jīng)濟(jì)高效、高性能且可擴(kuò)展的支持。Amazon FSx for Lustre可將文件系統(tǒng)連接至多個(gè)Amazon S3存儲(chǔ)桶,無(wú)縫訪問(wèn)Amazon S3中的數(shù)據(jù),優(yōu)化計(jì)算資源的吞吐量。同時(shí)Amazon FSx for Lustre與亞馬遜云科技的計(jì)算服務(wù)高度集成,可提供亞毫秒級(jí)延遲、高達(dá)每秒數(shù)百GB吞吐量和數(shù)百萬(wàn)的IOPS,能夠同時(shí)給上千臺(tái)運(yùn)行PB級(jí)數(shù)據(jù)復(fù)雜分析工作負(fù)載的計(jì)算實(shí)例提供支持,并且將分析結(jié)果的數(shù)據(jù)同步回寫至Amazon S3中。
對(duì)于醫(yī)療與生命科學(xué)行業(yè)所涉及的大規(guī)模計(jì)算工作負(fù)載,Amazon FSx for Lustre相當(dāng)于在對(duì)象存儲(chǔ)與計(jì)算集群之間加入了高性能緩存層,為存儲(chǔ)、計(jì)算兩端實(shí)現(xiàn)高效率的雙向數(shù)據(jù)同步;并且用戶無(wú)需在設(shè)置和管理Lustre文件系統(tǒng)上花費(fèi)精力,就能夠獲得充足的算力支持和更短的計(jì)算周期,并節(jié)省人力與計(jì)算成本。
位于上海的腫瘤精準(zhǔn)醫(yī)學(xué)企業(yè)桐樹基因,采用二代高通量測(cè)序技術(shù)進(jìn)行腫瘤基因檢測(cè),單個(gè)樣本可以產(chǎn)生108至109的短序列片段,每個(gè)序列片段又約是150個(gè)基因堿基長(zhǎng)度,單個(gè)樣本的文件大小可達(dá)10GB到30GB。隨著業(yè)務(wù)發(fā)展和樣本量增長(zhǎng),桐樹基因選擇遷移至亞馬遜云科技以解決對(duì)存儲(chǔ)、I/O和算力的要求。此后,桐樹科技一方面獲得Amazon S3的高性價(jià)比存儲(chǔ)服務(wù),另一方面也借助Amazon FSx for Lustre 為基因測(cè)序流程提供高性能共享文件存儲(chǔ),使單個(gè)樣本分析時(shí)間縮短30-40分鐘,批量樣本分析整體用時(shí)較過(guò)去節(jié)省達(dá)三分之二。
亞馬遜云科技豐富的存儲(chǔ)服務(wù),滿足醫(yī)療與生命科學(xué)行業(yè)的多樣化需求
在醫(yī)療與生命科學(xué)行業(yè),相對(duì)于初創(chuàng)企業(yè)從業(yè)務(wù)之初即原生上云,也有不少機(jī)構(gòu)需要將本地?cái)?shù)據(jù)存儲(chǔ)向云上遷移。對(duì)此,亞馬遜云科技不斷豐富"專門構(gòu)建"的Amazon FSx文件存儲(chǔ)系列服務(wù),幫助用戶在遷移時(shí)無(wú)需重構(gòu)應(yīng)用,就能繼續(xù)使用熟悉的文件管理系統(tǒng)。
除了Amazon FSx for Lustre,Amazon FSx文件存儲(chǔ)系列服務(wù)還包括Amazon FSx for Windows File Server,基于開源OpenZFS文件系統(tǒng)構(gòu)建的Amazon FSx for OpenZFS,以及Amazon FSx for NetApp ONTAP。例如,對(duì)于使用NetApp ONTAP文件存儲(chǔ)在線下構(gòu)建了自己的數(shù)據(jù)管理和應(yīng)用的醫(yī)療與生命科學(xué)行業(yè)用戶。這些企業(yè)在數(shù)據(jù)存儲(chǔ)遷移上云時(shí),可使用Amazon FSx for NetApp ONTAP,無(wú)需修改其應(yīng)用和數(shù)據(jù)管理方式,即可將部署在本地?cái)?shù)據(jù)中心的網(wǎng)絡(luò)文件存儲(chǔ)(NAS)設(shè)備上的應(yīng)用遷移至亞馬遜云科技,繼續(xù)使用自己熟悉的方式在云端部署、管理應(yīng)用和數(shù)據(jù),同時(shí)獲得FSx for NetApp ONTAP與亞馬遜云科技其它云服務(wù)之間的無(wú)縫集成。
亞馬遜云科技安全的數(shù)據(jù)保護(hù)功能,助力醫(yī)療與生命科學(xué)行業(yè)快速創(chuàng)新
此外,亞馬遜云科技的所有存儲(chǔ)服務(wù)都具有多重安全功能,并已通過(guò)權(quán)威的國(guó)際和本地技術(shù)測(cè)評(píng)與認(rèn)證,遵守嚴(yán)格的國(guó)際和本地合規(guī)原則。同時(shí),亞馬遜云科技還提供豐富的數(shù)據(jù)保護(hù)功能,實(shí)現(xiàn)關(guān)鍵數(shù)據(jù)的備份、容災(zāi)、一站式管理和快速恢復(fù),包括對(duì)不同應(yīng)用和數(shù)據(jù)源的一站式數(shù)據(jù)備份,跨區(qū)域遠(yuǎn)程復(fù)制服務(wù),以及多種數(shù)據(jù)快速恢復(fù)功能。亞馬遜云科技安全及豐富的數(shù)據(jù)保護(hù)功能,讓醫(yī)療與生命科學(xué)客戶可以更輕松滿足行業(yè)本身更高的安全與合規(guī)要求,將精力聚焦于業(yè)務(wù)創(chuàng)新上。
借助亞馬遜云科技提供的存儲(chǔ)服務(wù),醫(yī)療與生命科學(xué)行業(yè)客戶無(wú)論是海量數(shù)據(jù)存儲(chǔ),還是進(jìn)行基因研究、藥物分子篩選等大規(guī)模的數(shù)據(jù)計(jì)算,都能獲得更優(yōu)成本、卓越性能,以及滿足細(xì)分場(chǎng)景需求的多樣化解決方案,快速驅(qū)動(dòng)業(yè)務(wù)的創(chuàng)新發(fā)展。