東芝硬盤攜手寶德 HPC 在中國科學(xué)院 大連化學(xué)物理研究所成功應(yīng)用
客戶行業(yè)背景
中國科學(xué)院大連化學(xué)物理研究所(以下簡稱大連化物所)創(chuàng)建于1949年 3月,是一個基礎(chǔ)研究與應(yīng)用研究并重、應(yīng)用研究和技術(shù)轉(zhuǎn)化相結(jié)合,以任務(wù)帶學(xué)科為主要特色的綜合性研究所。大連化物所重 點學(xué)科領(lǐng)域為: 催化化學(xué)、工程化學(xué)、化學(xué)激光和分子反應(yīng)動力學(xué)以及近代分析化學(xué)和Th物技術(shù)自建院以來,大連化物所在催化化學(xué)、工程化學(xué)、有機合成化 學(xué)、化學(xué)雷射和分子反應(yīng)動力學(xué)、以色譜為主的近代分析化學(xué)和Th物技 術(shù)等學(xué)科領(lǐng)域取得大量重大科技成果。目前下設(shè)十個研究室,其中有三個國家級重點實驗室和四個國家級研究中心,另有籌建中的潔凈能源國家實驗室。參與了中國載人航天計劃。迄今已與32國建立了科技合作和交流關(guān)系,合作領(lǐng)域集中于催化及燃料電池。研究所成立以來,先后有 15位科學(xué)家當(dāng)選為中國科學(xué)院和中國工程院院士。 2009年底共有職工912人,其中專業(yè)技術(shù)人員770人,研究員108人,副研究員235人。1998 年成為中科院知識創(chuàng)新工程首批試點單位之一。大連化物所同時也是中華人民共和國國務(wù)院學(xué)位委員會授權(quán)培養(yǎng)博士、碩士學(xué)位的單位,具有化學(xué)和化工一級學(xué)科博士學(xué)位授予權(quán)和博士Th導(dǎo)師資格的審批權(quán)。
系統(tǒng)現(xiàn)狀與挑戰(zhàn)
大連化物所需要采集、分析和處理大量的數(shù)據(jù)來解決復(fù)雜的科學(xué)問題, 所以必然需要高性能計算系統(tǒng)的支持。客戶于2010年建設(shè)了一套用于科學(xué)計算的高性能計算平臺,采用5臺單路Xeon E3系列CPU服務(wù)器作為計算節(jié)點,并組成Computing Cluster,每臺計算節(jié)點配備2塊希捷 300GB SAS 10K rpm 硬盤,組建成raid 1,用于安裝操作系統(tǒng);存儲服務(wù)器配備4塊2TB SATA 7200rpm 硬盤,組建成raid 5,用于存放數(shù)據(jù)模型和計算結(jié)果等文件;計算節(jié)點與存儲服務(wù)器之間用千兆以太網(wǎng)交換機進行連接,用于計算節(jié)點與存儲服務(wù)器之間的數(shù)據(jù)傳輸。 計算平臺剛建成時,要用到高性能計算的研究課題還不是很多,計算任務(wù)平均每周不到2個,且計算時間也一般不會超過8小時,隨著化物所的研究課題數(shù)量增多,研究力度的加大,如分子反應(yīng)動力學(xué),復(fù)雜Th物樣品的高效分離與表征課題的深入研究等等,計算平臺平均每天都有2個或大或小的計算任務(wù)被提交,以每月統(tǒng)計來看,平均每個計算任務(wù)需花3小時完成,且任務(wù)排程上經(jīng)常有10個左右的任務(wù)在等待調(diào)度,如此一來,新的計算任務(wù)提交后需要等待一到兩天才能安排處理,加上任務(wù)本身計算所花掉的時間,研究人員拿到計算結(jié)果經(jīng)常是2-3天后的認可。
需求分析
1. 儲存設(shè)備效能低落: 原計算平臺存儲系統(tǒng)采用簡易NAS構(gòu)架,所用的存儲介質(zhì)為2TB SATA 7200rpm硬盤,讀寫性能不高,且存儲設(shè)備不是專用NAS設(shè)備,硬盤擴容受限,文件系統(tǒng)穩(wěn)定性也不高。
2. 計算能力資源不足: 計算節(jié)點數(shù)量少,且采用300GB SAS 10K rpm硬盤,存儲空間較小,轉(zhuǎn)速偏低,模型計算過程中所產(chǎn) Th的大量緩存文件存放于計算節(jié)點硬盤中,嚴重影響內(nèi)存與硬盤之間的交互效率。
3. 網(wǎng)絡(luò)傳輸瓶頸: 計算節(jié)點與存儲服務(wù)器之間采用千兆ethernet交換機作為數(shù)據(jù)傳輸,傳輸速率和硬盤讀寫速率相比不在一個量級上。
4. 舊系統(tǒng)架構(gòu)跟不上新需求的變化: 研究所內(nèi)的科研課題數(shù)量增多,深度加大,高性能計算任務(wù)隨之增多,導(dǎo)致計算平臺無法及時處理計算任務(wù)。 在計算平臺整體性能不佳,擴展受限,加上其所搭載操作系統(tǒng)的傳統(tǒng)硬盤更是瓶頸所在,因此要在有限空間和計算能力下完成科研項目,難上加難。經(jīng)研究所相關(guān)部門討論決定,新建一套高性能計算平臺,以支持新的科研項目。
東芝與寶德提供的合作解決方案
系統(tǒng)拓樸圖如下
PowerLeader HPC Cluster
KVM Ethernet Switch Management Server
此次東芝與寶德的合作解決方案中,其項目計算節(jié)點采用寶德PR4712GW多子星服務(wù)器,是基于模塊化設(shè)計理念而開發(fā)的新一代高密度服務(wù)器。在 4U的空間內(nèi)達到 4 個計算節(jié)點,充分滿足隨需擴展的超高密度部署需求。每個計算節(jié)點配置2塊東芝400G企業(yè)級固態(tài)硬盤(PX04SMB040),并組建 成raid 1用于系統(tǒng)加速,同時配備1塊東芝2TB 7200 rpm SATA企業(yè)級硬盤(MG03SCA200),用于存放計算過程中產(chǎn)Th的過程文件和臨時文件;1塊英偉達GPU加速卡和兩顆 E5-2600系列CPU。 儲存設(shè)備GS5120FD則采用東芝最新一代固態(tài)硬盤(PX04SMB040)和高穩(wěn)定企業(yè)級SATA 硬盤(MG03ACA400)。 配備2塊東芝SSD 組建成Raid1用于緩存加速,同時配備10塊4T 7200 rpm SATA硬盤用于存儲 計算模型、元數(shù)據(jù)和過程文件。滿足高IOPS、高帶寬的同時,保證節(jié)點存儲系統(tǒng)的可靠性和經(jīng)濟性,消除了計算集群的數(shù)據(jù) 讀寫瓶頸,使整個平臺性能達至最優(yōu)。 東芝與寶德科技針對此次大連化物所的研究要求,方案中共配置 2 個管理節(jié)點,56 個計算節(jié)點,千兆交換機管理網(wǎng)絡(luò)系統(tǒng)和IB網(wǎng)絡(luò),光纖存儲 GS5120FD, 大規(guī)模機房管理 KVM 切換系統(tǒng)、監(jiān)控系統(tǒng)以及內(nèi)置控制臺等共同構(gòu)成了高速計算、海量數(shù)據(jù)傳輸網(wǎng)格計算集群系統(tǒng)。 系統(tǒng)采用 Rocks 管理軟件實現(xiàn)節(jié)點管理、任務(wù)分發(fā)和集群監(jiān)控,優(yōu)化通信庫模塊來實現(xiàn)節(jié)點之間的進程通信,近乎達到大型機中多進程間消息傳輸機制的效率,再加上東芝固態(tài)硬盤的高傳輸速率,消除數(shù)據(jù)傳輸瓶頸,使整個系統(tǒng)性能發(fā)揮得淋漓盡致。。
效益與成果
大連化物所通過應(yīng)用了寶德高密度四子星服務(wù)器的 HPC 系統(tǒng),能在較小的空間達到較高的計算節(jié)點。整個高性能計算集群系統(tǒng)由于采用了業(yè)內(nèi)領(lǐng)先的技術(shù),不僅性能突出,安全穩(wěn)定,在未來的較長時間保持高效領(lǐng)先的高性能計算能力。整個系統(tǒng) 具有很好的彈性化設(shè)計,客戶將來如需提高計算性能,用戶可橫向接入計算節(jié)點;如需提高存儲性能,東芝可提供廣泛容量范圍和較大讀寫性能區(qū)間的硬盤供用戶選擇;也可橫向接入存儲節(jié)點或縱向級聯(lián)擴展存儲柜增加存儲空間。用56Gb/s傳輸速率的IB交換機取代1Gb的以太網(wǎng)交換機,在未來較長時間內(nèi),都能承載計算節(jié)點與存儲節(jié)點的傳輸出帶寬需求。如此一來,新的設(shè)計方案從計算、存儲和網(wǎng)絡(luò)三方面的性能提升和彈性化設(shè)計,很好的滿足了用戶對計算平臺的高性能要求和消除了對平臺擴展的顧慮。 整個集群系統(tǒng)能很好的提高科學(xué)研究的工作效率。在原計算平臺處理需21小時的計算任務(wù),在新平臺上僅需1.5小時就能完成,新平臺的處理性能是原平臺的14倍。
不僅是由于方案提供了更高性能、更多數(shù)量的計算節(jié)點,而且,更是憑借多節(jié)點服務(wù)器與東芝SSD的完美結(jié)合,加快了系統(tǒng)響應(yīng)速度;直觀體現(xiàn)在服務(wù)器開機時間由使用東芝SSD之前需60秒,配備東芝 SSD后,開機時間縮短至30秒,硬盤讀寫性能提升2倍。
計算平臺采用寶德高密度四子星服務(wù)器和東芝高存儲容量硬盤,設(shè)備總體占用機房空間與傳統(tǒng)標(biāo)準服務(wù)器和傳統(tǒng)1TB容量硬盤相比,空間節(jié)約50%;單臺四子星服務(wù)器電源功率為2KW,而4臺計算性能相當(dāng)?shù)膫鹘y(tǒng)標(biāo)準服務(wù)器服務(wù)器總功率為3.2KW, 能耗節(jié)省37.5%。在提供如此強大的計算性能的情況下,同時為客戶節(jié)省了計算平臺的后期的運行成本,也響應(yīng)了客戶”Do more with less”的環(huán)保精神,中國科學(xué)院大連化物所對本次項目合作非常滿意。
合作伙伴與未來規(guī)劃
本次項目的成功要感謝大連化物所領(lǐng)導(dǎo)和同事對項目的高度重視和大力支持,正是有了你們的幫助和配合,項目才能進行得如此順利。 還要感謝東芝公司提供的針對本項目的存儲解決方案和長期以來對我公司的大力支持。 東芝是全球唯一一家同時提供SSD和HDD全系列產(chǎn)品解決方案的存儲公司,東芝為寶德服務(wù)器產(chǎn)品解決方案提供了更加靈活的存儲產(chǎn)品選擇。東芝與寶德一直以來保持良好合作與緊密的溝通,東芝深圳實驗室專門采購寶德主流機型做長期的兼容性測試,并且寶德使用東芝企業(yè)級硬盤返修率控制在0.5%以內(nèi)。 寶德產(chǎn)品部陳總提到,東芝為我們提供了高性價比的產(chǎn)品、專業(yè)的產(chǎn)品解決方案和優(yōu)質(zhì)的售后服務(wù),與東芝合作是前所未有的順暢和愉快!