平頭哥首款SSD主控芯片,不止存力強大這么簡單!
近年來,以AI、云計算等新興技術(shù)為代表的數(shù)字化轉(zhuǎn)型引發(fā)了一系列數(shù)據(jù)爆炸。這一趨勢不僅讓海量數(shù)據(jù)存儲的重要性日益凸顯,同時也推動著海量數(shù)據(jù)存儲加速走向變革。
為了滿足云服務(wù)器和企業(yè)服務(wù)器等數(shù)據(jù)中心的存儲需求,今天(11月1日)阿里旗下半導(dǎo)體公司“平頭哥”宣布,其自主研發(fā)的首款SSD主控芯片“鎮(zhèn)岳510”正式發(fā)布。
▲平頭哥發(fā)布首款SSD主控芯片“鎮(zhèn)岳510”
▌多重技術(shù)加持,構(gòu)建先進數(shù)據(jù)存力
SSD主控芯片是一種具有獨立智能控制功能的集成電路,主要負責(zé)主機交互、協(xié)議解析與執(zhí)行、數(shù)據(jù)調(diào)度、后臺任務(wù)等。作為固態(tài)硬盤中的核心器件,SSD主控芯片在國內(nèi)外都擁有著強勁的市場需求。
根據(jù)市場研究機構(gòu)Maximize Market Research的數(shù)據(jù)顯示,2022年全球SSD市場規(guī)模為243.6億美元,預(yù)計到2029年復(fù)合年增長率達14.31%。另據(jù)《中國存力白皮書(2023年)》統(tǒng)計,2022年全國存力總規(guī)模(5年計量)達到1000EB,較2021年增長25%。
盡管這一領(lǐng)域長期被Marvell、三星等國際廠商所壟斷,但近年來,隨著國家對數(shù)據(jù)安全自主可控的重視程度不斷增加,國產(chǎn)SSD也開始逐漸嶄露頭角,而平頭哥就是其中的代表企業(yè)之一。
▲圖片來源:Maximize Market Research
對于SSD來說,一款主控芯片的好壞將直接決定了固態(tài)硬盤的實際體驗和使用壽命;而不同架構(gòu)、核心/晶體管數(shù)量的多少、頻率的高低,則關(guān)乎著主控的整體性能。那么,此次平頭哥發(fā)布的鎮(zhèn)岳510,其性能與可靠性又如何呢?
據(jù)平頭哥SSD產(chǎn)品負責(zé)人周冠鋒介紹,鎮(zhèn)岳510在硬件架構(gòu)、算法等方面都是平頭哥自研,在核心指標上處于業(yè)界領(lǐng)先地位。
“鎮(zhèn)岳510每秒可處理高達340萬筆IO。一枚鎮(zhèn)岳510的性能,相當于1萬塊高性能HDD的性能總和。此外,鎮(zhèn)岳510還擁有極高的能效比,每瓦功耗可提供42萬筆IO訪問。”周冠鋒補充道。
▲平頭哥SSD產(chǎn)品負責(zé)人周冠鋒
以一個部署10萬塊SSD的數(shù)據(jù)中心為例,相比目前主流的PCIe 4.0SSD,鎮(zhèn)岳510在相同的性能下,僅主控芯片即每年節(jié)省260萬度電,按照一度電排放0.785千克二氧化碳計算,每年可減少二氧化碳排放2千噸。
在實際應(yīng)用方面,鎮(zhèn)岳510內(nèi)置創(chuàng)新的IO自動化處理機制,前端IO解析與處理,由專用硬件模塊自動完成,實現(xiàn)了業(yè)界領(lǐng)先的超低的時延(4μs),可以帶給應(yīng)用極佳的體驗,比業(yè)界SSD降低30%以上。不僅如此,鎮(zhèn)岳510芯片內(nèi)還實現(xiàn)了IO/SYS/GC的全鏈路隔離,極大地降低了這些任務(wù)之間的相互干擾,提供了既低又穩(wěn)定的時延表現(xiàn)。
值得一提的是,鎮(zhèn)岳510還內(nèi)置了平頭哥自研的高性能LDPC糾錯算法,編碼效率逼近香農(nóng)極限,同時ErrorFlow相比業(yè)內(nèi)SSD更優(yōu)一個數(shù)量級。另外,借助平頭哥自研閃存電壓預(yù)測算法,還可以在各種閃存的不同工況、壽命、溫度等條件下,準確預(yù)測閃存電壓漂移,進一步降低LDPC解碼器的輸入誤碼率。
“基于這些技術(shù)優(yōu)勢,鎮(zhèn)岳510實現(xiàn)了低至10^-18的UBER,這相當于每讀取百億億筆數(shù)據(jù),才可能有一筆數(shù)據(jù)糾錯失敗?!敝芄阡h如是說。
▌為云計算定制,打造極致存儲體驗
鎮(zhèn)岳510不僅具備更強存力、更高可靠等特點,還能通過為云定制,帶來更優(yōu)秀的存儲體驗。
在談及定制化方案時,周冠鋒表示,在傳統(tǒng)的系統(tǒng)方案中,SSD與存儲系統(tǒng)分離設(shè)計。SSD負責(zé)底層閃存數(shù)據(jù)排布,但無存儲語義而無法達到最佳排布;SSD負責(zé)后臺任務(wù),但無法判斷最佳啟停時機;而存儲系統(tǒng)有存儲語義卻無法排布閃存數(shù)據(jù),有最佳時機卻無法啟停SSD后臺任務(wù)。上下的割裂給整個存儲系統(tǒng)的性能與壽命帶來了額外消耗,這被稱為“SSD接口稅”。
因此,ZNS協(xié)議被發(fā)展出來,通過將盤內(nèi)FTL層上移至存儲系統(tǒng),達到了存儲系統(tǒng)與閃存特性的完美匹配,消減了“SSD接口稅”。2021年5月,ZNS協(xié)議被收入NVMe規(guī)范2.0版本中,并得到了SPDK、Linux以及各設(shè)備商的支持。
此次發(fā)布的鎮(zhèn)岳510則完美地實現(xiàn)了ZNS協(xié)議,通過靈活的硬件表項加速保持了高IO性能,而Zone分區(qū)狀態(tài)則交由玄鐵910維護,保留了對新協(xié)議的靈活性。此外,鎮(zhèn)岳510還定制了Last Sector隨機寫功能,實現(xiàn)了小報文的多次反復(fù)下盤,簡化了ZNS的應(yīng)用難度。
據(jù)了解,數(shù)據(jù)請求可以分為帶寬敏感型與時延敏感型,不同的請求應(yīng)予以不同的處理策略,才能達到業(yè)務(wù)最佳SLA。NVMe規(guī)范中制定了以隊列為粒度的標準SQ調(diào)度機制,但其靈活性較差,對于業(yè)務(wù)種類復(fù)雜、追求靈活可配的云存儲系統(tǒng)來說,它并不是最佳選擇。
“而鎮(zhèn)岳510在支持NVMe標準的SQ調(diào)度機制的同時,額外定制了基于IO粒度的優(yōu)先級調(diào)度機制,允許系統(tǒng)按IO打標,優(yōu)先級種類多達8級,結(jié)合云存儲系統(tǒng),能夠更好的保障延遲敏感型業(yè)務(wù)的服務(wù)質(zhì)量?!敝芄阡h進一步介紹道。
云存儲系統(tǒng)的完整數(shù)據(jù)鏈路,從計算端開始,通過網(wǎng)絡(luò)到存儲服務(wù)器,再通過內(nèi)部互聯(lián)到達SSD。為了保障數(shù)據(jù)的高可靠,全鏈路應(yīng)采用語義一致的完整性校驗。但NVMe規(guī)范只規(guī)定了以Sector為單位按照T10 DIF/DIX的校驗機制,與存儲系統(tǒng)的語義并不相同,因此SSD的校驗與存儲系統(tǒng)的校驗產(chǎn)生了差異。
鎮(zhèn)岳510以IO為粒度,遵循上層存儲語義進行校驗,補齊了整個存儲系統(tǒng)的數(shù)據(jù)鏈路校驗的最后一環(huán)。不僅如此,鎮(zhèn)岳510還支持以存儲語義對內(nèi)部數(shù)據(jù)進行后臺巡檢,而無需再讀出至服務(wù)器,從而節(jié)省了寶貴的PCIe帶寬、服務(wù)器內(nèi)存帶寬與CPU算力。
總之,鎮(zhèn)岳510可以更好地滿足云上業(yè)務(wù)迅猛發(fā)展所帶來的存力需求,非常適用于大數(shù)據(jù)分析、在線交易和在線分析,以及高性能數(shù)據(jù)庫等場景。憑借上述功能的增強和性能的提升,可以預(yù)見,鎮(zhèn)岳510將會重新定義未來數(shù)據(jù)存力。