當(dāng)前位置:首頁(yè) > 工業(yè)控制 > 《機(jī)電信息》
[導(dǎo)讀]摘要:變電站自動(dòng)化設(shè)備大量使用固態(tài)硬盤外存儲(chǔ)器,而固態(tài)硬盤的全擦寫次數(shù)達(dá)到一定量時(shí)將影響自動(dòng)化設(shè)備的正常運(yùn)行?,F(xiàn)對(duì)一起變電站設(shè)備典型的SSD故障案例進(jìn)行分析,確認(rèn)了自動(dòng)化設(shè)備不恰當(dāng)?shù)能浖褂梅绞綄O大地縮短固態(tài)硬盤的使用壽命。為此,開發(fā)固態(tài)硬盤狀態(tài)監(jiān)測(cè)功能,從預(yù)留容量、讀寫速度、預(yù)估壽命三個(gè)方面進(jìn)行監(jiān)測(cè)及預(yù)警,為應(yīng)用固態(tài)硬盤存儲(chǔ)的自動(dòng)化設(shè)備的可靠運(yùn)行提供技術(shù)保障。

固態(tài)硬盤在變電站自動(dòng)化設(shè)備中的應(yīng)用

摘要:變電站自動(dòng)化設(shè)備大量使用固態(tài)硬盤外存儲(chǔ)器,而固態(tài)硬盤的全擦寫次數(shù)達(dá)到一定量時(shí)將影響自動(dòng)化設(shè)備的正常運(yùn)行?,F(xiàn)對(duì)一起變電站設(shè)備典型的SSD故障案例進(jìn)行分析,確認(rèn)了自動(dòng)化設(shè)備不恰當(dāng)?shù)能浖褂梅绞綄O大地縮短固態(tài)硬盤的使用壽命。為此,開發(fā)固態(tài)硬盤狀態(tài)監(jiān)測(cè)功能,從預(yù)留容量、讀寫速度、預(yù)估壽命三個(gè)方面進(jìn)行監(jiān)測(cè)及預(yù)警,為應(yīng)用固態(tài)硬盤存儲(chǔ)的自動(dòng)化設(shè)備的可靠運(yùn)行提供技術(shù)保障。

關(guān)鍵詞:

0引言

不同于使用磁盤作為存儲(chǔ)介質(zhì),通過(guò)旋轉(zhuǎn)磁頭來(lái)進(jìn)行數(shù)據(jù)存取的傳統(tǒng)機(jī)械硬盤,固態(tài)硬盤(solidstateDrives,SSD)是用閃存電子存儲(chǔ)芯片陣列制成的硬盤,無(wú)任何機(jī)械活動(dòng)部件。

雖然機(jī)械硬盤憑借容量大、性價(jià)比高、使用壽命長(zhǎng)、數(shù)據(jù)易恢復(fù)等優(yōu)點(diǎn)占領(lǐng)著主要的存儲(chǔ)市場(chǎng),但固態(tài)硬盤由于其讀寫速度快、體積小、功耗低、抗振強(qiáng)、工作溫度范圍廣等優(yōu)勢(shì),在航空、電力等工業(yè)領(lǐng)域和消費(fèi)電子領(lǐng)域仍獲得了廣泛應(yīng)用。

由于有相關(guān)標(biāo)準(zhǔn)明確要求不得使用旋轉(zhuǎn)部件等原因,變電站自動(dòng)化設(shè)備更是大量采用了固態(tài)硬件作為外存儲(chǔ)器存儲(chǔ)程序和數(shù)據(jù),如數(shù)據(jù)通信網(wǎng)關(guān)機(jī)、智能遠(yuǎn)動(dòng)機(jī)、PMU相量測(cè)量裝置、保護(hù)信息管理單元等。

目前,有不少文獻(xiàn)研究討論了固態(tài)硬盤的應(yīng)用。

文獻(xiàn)將固態(tài)硬盤與傳統(tǒng)磁盤組合,利用固態(tài)硬盤高性能和傳統(tǒng)磁盤低成本、大容量的特點(diǎn),能夠?yàn)橛脩籼峁┐笕萘康拇鎯?chǔ)空間,保證系統(tǒng)的高性能,同時(shí)還能降低成本。

文獻(xiàn)對(duì)固態(tài)硬盤和傳統(tǒng)硬盤進(jìn)行了性能測(cè)試、對(duì)比分析,通過(guò)測(cè)驗(yàn)計(jì)算機(jī)響應(yīng)時(shí)間,設(shè)計(jì)了使用SSD的計(jì)算機(jī)升級(jí)方案,提升了計(jì)算機(jī)系統(tǒng)整體性能并延長(zhǎng)了計(jì)算機(jī)服務(wù)年限。

文獻(xiàn)在變電站的繼電保護(hù)裝置中采用固態(tài)硬盤作為存儲(chǔ)介質(zhì),基于PCIe總線技術(shù)實(shí)現(xiàn)了大容量存儲(chǔ)系統(tǒng)設(shè)計(jì),滿足了繼電保護(hù)裝置對(duì)數(shù)據(jù)處理安全可靠性的要求。

文獻(xiàn)通過(guò)固態(tài)硬盤測(cè)試,獲得了讀寫比例、數(shù)據(jù)包大小、訪問(wèn)模式等工況變化和供電電壓波動(dòng)對(duì)讀/寫速度、電流等性能特性的影響規(guī)律,測(cè)試結(jié)果表明,固態(tài)硬盤使用過(guò)程中應(yīng)保證輸入電壓的穩(wěn)定性。

1固態(tài)硬盤的性能和壽命

硬盤的性能主要指數(shù)據(jù)讀寫速度,長(zhǎng)期以來(lái)遠(yuǎn)低于處理器和內(nèi)存。

機(jī)械硬盤讀取數(shù)據(jù)的方式是通過(guò)磁頭在高速旋轉(zhuǎn)的盤片上進(jìn)行磁操作。受限于磁頭機(jī)械轉(zhuǎn)速,轉(zhuǎn)速7200r/min的機(jī)械盤,其大數(shù)據(jù)順序讀速度能達(dá)到160MB/s,寫速度達(dá)到80MB/s。

固態(tài)硬盤讀寫時(shí)是對(duì)閃存存儲(chǔ)元件進(jìn)行電子存取操作,速度更快,即使存在主控芯片的操作延時(shí),其讀寫速度仍能達(dá)到500MB/s,是機(jī)械硬盤的數(shù)倍。

機(jī)械磁盤受限于磁頭移動(dòng)和磁盤旋轉(zhuǎn)等機(jī)械運(yùn)動(dòng),響應(yīng)時(shí)間和吞吐率已經(jīng)遠(yuǎn)遠(yuǎn)落后于CPU和內(nèi)存,SSD外存儲(chǔ)器高速讀寫的優(yōu)勢(shì),有效緩解了計(jì)算機(jī)系統(tǒng)長(zhǎng)期存在的硬盤I0速度瓶頸問(wèn)題。

固態(tài)硬盤的壽命主要和存儲(chǔ)單元的擦寫次數(shù)有關(guān),隨著擦寫次數(shù)上升到壽命限值,硬盤的讀寫性能下降,存儲(chǔ)的數(shù)據(jù)也會(huì)變得不可信。

固態(tài)硬盤寫入數(shù)據(jù)到存儲(chǔ)單元稱為一次擦寫,將所有的存儲(chǔ)單元全部擦寫過(guò),則稱為一次全擦寫(P/E)。所有固態(tài)硬盤都有全擦寫限值,根據(jù)閃存單元的工藝不同,全擦寫限值有數(shù)萬(wàn)次、數(shù)千次、數(shù)百次不等。

固態(tài)硬盤使用的閃存單元技術(shù)原理是一種基于浮柵技術(shù)的場(chǎng)效應(yīng)管(M0s晶體管),根據(jù)浮柵內(nèi)存儲(chǔ)的電子數(shù)量不同所表現(xiàn)的電壓值來(lái)表現(xiàn)不同的數(shù)據(jù)值。數(shù)據(jù)值分為1、2、3和4比特,分別對(duì)應(yīng)閃存單元的4種類型:單級(jí)閃存單元)sLC)、二級(jí)閃存單元)MLC)、三級(jí)閃存單元)TLC)和四級(jí)閃存單元)0LC)。單位存儲(chǔ)能力提高的同時(shí)伴隨的是壽命的下降,一般認(rèn)為sLC的壽命下限為全擦寫10000次,MLC為3000次,TCL為1000次,0LC為150次,而價(jià)格同樣依次下降。

固態(tài)硬盤一般由主控器、存儲(chǔ)介質(zhì)和固件組成,相應(yīng)也有核心技術(shù)來(lái)保障硬盤性能和壽命。固件技術(shù)將存儲(chǔ)介質(zhì)組織成塊并進(jìn)行管理,建立邏輯地址和物理地址的映射關(guān)系,以提高讀取/寫入效率并平衡寫入次數(shù)。

存儲(chǔ)塊頻繁寫入超過(guò)限值后,將造成存儲(chǔ)顆粒老化,成為壞塊。因此,數(shù)據(jù)寫入時(shí)主控器會(huì)協(xié)調(diào)寫入擦寫次數(shù)最少的存儲(chǔ)塊,來(lái)保障所有存儲(chǔ)塊的擦寫次數(shù)接近,該過(guò)程稱為"磨損均衡"。

優(yōu)化的磨損均衡算法會(huì)將硬盤中存在的長(zhǎng)期不變數(shù)據(jù)也進(jìn)行遷移,用空出的較新存儲(chǔ)塊寫入新數(shù)據(jù),實(shí)現(xiàn)靜態(tài)磨損均衡。因此,每次上層應(yīng)用要求寫入的數(shù)據(jù)量會(huì)小于實(shí)際寫入存儲(chǔ)單元的數(shù)據(jù)量,該現(xiàn)象稱為"寫入放大"。

存儲(chǔ)單元按塊管理,則小數(shù)據(jù)寫入會(huì)占用多余的存儲(chǔ)單元,這一過(guò)程也會(huì)產(chǎn)生寫入放大,因此會(huì)針對(duì)小數(shù)據(jù)進(jìn)行合理遷移并開展垃圾回收。提高磨損均衡的合理性,優(yōu)化垃圾回收算法,降低寫入放大系數(shù),是固態(tài)硬盤優(yōu)化的核心技術(shù),能夠有效提升固態(tài)硬盤的使用壽命。

文獻(xiàn)提出了一種全程優(yōu)化的垃圾回收方法,在數(shù)據(jù)初始放置、垃圾回收目標(biāo)塊的選擇、有效數(shù)據(jù)的遷移等方面盡可能全面地考慮各步驟對(duì)SSD壽命的影響,同典型算法相比,可以減少壽命磨損近30%。

文獻(xiàn)提出一種超級(jí)塊重組算法,在垃圾回收時(shí)挑選每個(gè)閃存上有效數(shù)據(jù)量最小的物理塊來(lái)重組超級(jí)塊,作為垃圾回收的源超級(jí)塊。

實(shí)驗(yàn)結(jié)果表明,和傳統(tǒng)的垃圾回收算法相比,該算法能減小2/3的寫入放大,系統(tǒng)壽命提升將近3倍,適用于預(yù)留空間小但對(duì)系統(tǒng)壽命和滿盤下寫性能有要求的場(chǎng)景。

文獻(xiàn)提出采用在控制器內(nèi)部配置緩存設(shè)備的方式提高固態(tài)硬盤整體性能,緩存設(shè)備可使隨機(jī)小數(shù)據(jù)寫入時(shí)只寫入緩存而不是閃存介質(zhì),當(dāng)匯總數(shù)據(jù)量較大時(shí)批量寫入,該方法能有效延長(zhǎng)硬盤使用壽命,但需要增加掉電保護(hù)機(jī)制防止緩存數(shù)據(jù)丟失。

文獻(xiàn)綜述了提高SSD耐久度的方法,包括改善磨損均衡算法、使用外部數(shù)據(jù)緩沖、降低寫入放大系數(shù)、提升預(yù)留空間、應(yīng)用區(qū)塊磨損反饋技術(shù)等。

2變電站設(shè)備典型SSD故障案例

某500kV變電站使用的遠(yuǎn)動(dòng)網(wǎng)關(guān)機(jī)在投運(yùn)半年后即頻繁出現(xiàn)程序退出、設(shè)備死機(jī)等現(xiàn)象,重啟后能恢復(fù)。設(shè)備商檢測(cè)分析后確認(rèn)SSD)MLC顆粒)平均全擦寫次數(shù)為2500次,已接近3000次,部分存儲(chǔ)顆粒磨損度較高。更換SSD后問(wèn)題解決,裝置運(yùn)行正常,但仍需定量地進(jìn)行分析,確定SSD寫入數(shù)據(jù)量、P/E次數(shù)與故障的關(guān)系。

SSD的寫入數(shù)據(jù)量可以使用Linux系統(tǒng)自帶的iotop命令監(jiān)測(cè),P/E次數(shù)則需要硬盤供應(yīng)商提供相應(yīng)的工具來(lái)獲得?,F(xiàn)場(chǎng)SSD為MLC存儲(chǔ)顆粒,64GB容量,不帶緩存。

模擬變電站數(shù)據(jù)環(huán)境,使用3臺(tái)樣機(jī)和SSD進(jìn)行測(cè)試,記錄操作系統(tǒng)的日平均寫入數(shù)據(jù)量,和SSD檢測(cè)工具獲得的日平均P/E次數(shù)進(jìn)行對(duì)比,結(jié)果如表1所示。

測(cè)試得出以下結(jié)論:

(1)帶緩存機(jī)制的SSD能有效延長(zhǎng)使用壽命,降低放大系數(shù):

(2)隨著SSD累積P/E次數(shù)的增加,放大系數(shù)會(huì)增大很多:

(3)假定放大系數(shù)與當(dāng)前已擦寫次數(shù)為正相關(guān),則該型號(hào)SSD的預(yù)估壽命在0.6~2.3年。

現(xiàn)場(chǎng)SSD故障出現(xiàn)在設(shè)備投運(yùn)半年后,考慮到設(shè)備前期的場(chǎng)內(nèi)調(diào)試、現(xiàn)場(chǎng)調(diào)試至少有4個(gè)月時(shí)間,可以認(rèn)為壽命對(duì)比測(cè)試的結(jié)論較為符合現(xiàn)場(chǎng)情況。MLC顆粒的SSD理論累積P/E次數(shù)下限為3000次,而本次故障發(fā)現(xiàn)平均P/E次數(shù)達(dá)2500次時(shí)已頻繁出現(xiàn)讀寫到壞塊導(dǎo)致設(shè)備故障的情況,合理推斷是該型號(hào)SSD的磨損均衡算法效果不佳,造成部分存儲(chǔ)顆粒因磨損過(guò)度已經(jīng)退化,造成設(shè)備程序或操作系統(tǒng)運(yùn)行異常。

另外,日均30GB的寫入數(shù)據(jù)量與變電站遠(yuǎn)動(dòng)機(jī)的場(chǎng)景認(rèn)知有偏差,為查明寫入數(shù)據(jù)量的程序比例,持續(xù)使用iotop命令定位分析程序的數(shù)據(jù)寫入量,發(fā)現(xiàn)存在某個(gè)服務(wù)程序的日均數(shù)據(jù)寫入量達(dá)到了26GB。通過(guò)與軟件供應(yīng)商溝通,確認(rèn)是該遠(yuǎn)動(dòng)機(jī)啟用了一個(gè)數(shù)據(jù)斷面定時(shí)保存功能造成的。該功能不是必需的,取消后該站的SSD日平均寫入數(shù)據(jù)量降低為4GB,預(yù)計(jì)壽命能延長(zhǎng)7倍。

最終該故障現(xiàn)象得到根本解決的方法為:

(1)變電站自動(dòng)化設(shè)備換用其他品牌帶緩存機(jī)制的SSD;

(2)關(guān)閉自動(dòng)化設(shè)備系統(tǒng)軟件中不必要的數(shù)據(jù)保存功能。

3自動(dòng)化設(shè)備SSD狀態(tài)監(jiān)測(cè)

變電站設(shè)備使用SSD,需對(duì)其狀態(tài)進(jìn)行在線監(jiān)測(cè),評(píng)估性能變化和使用壽命,在SSD顆粒老化前預(yù)警。監(jiān)測(cè)對(duì)象包括:

3.1SSD剩余空間

SSD的寫入放大系數(shù)與剩余空間有高度相關(guān)性,剩余空間越大,則寫入放大系數(shù)越小。研究數(shù)據(jù)表明,剩余容量為50%時(shí),寫入放大系數(shù)為2左右[l2];當(dāng)剩余容量低于20%時(shí),寫入放大系數(shù)會(huì)增大較多。因此,需要對(duì)剩余空間進(jìn)行監(jiān)測(cè)預(yù)警,低于20%的可用空間時(shí),使告警指示燈亮。

3.2SSD讀寫速度

如能使用供應(yīng)商自帶的工具定期對(duì)SSD進(jìn)行狀態(tài)監(jiān)測(cè),是較為合理的方式。除此之外,考慮到SSD品牌的多樣性,可以定期對(duì)SSD進(jìn)行順序讀寫測(cè)試來(lái)檢測(cè)硬盤性能是否有明顯下降,一般設(shè)定標(biāo)稱告警值為100MB/s,連續(xù)多次速度檢測(cè)低于該值時(shí)設(shè)備應(yīng)告警。

測(cè)試寫入過(guò)程不應(yīng)對(duì)SSD造成較大的損耗,測(cè)試建議單次數(shù)據(jù)量為32kB,連續(xù)寫入1024次,每天執(zhí)行一次監(jiān)測(cè),則當(dāng)天數(shù)據(jù)量不超過(guò)40MB,對(duì)SSD損耗相對(duì)較小。測(cè)試寫性能,Linux設(shè)備一般可使用dd命令:

ddif=/dev/zeroof=/home/data/test.outbs=32Kcount=1024conv=fsync

如為機(jī)械硬盤,測(cè)試結(jié)果一般返回在100MB/s左右,固態(tài)硬盤在500MB/s左右。

3.3SSD壽命預(yù)估

自動(dòng)化設(shè)備的狀態(tài)監(jiān)測(cè)軟件模塊集成供應(yīng)商提供的監(jiān)測(cè)工具,每日定時(shí)對(duì)SSD進(jìn)行一次狀態(tài)讀取,獲取當(dāng)前全擦寫P/E次數(shù)s,與前一天的差值即為日P/E次數(shù)T,以公式(3000-s)/T來(lái)預(yù)估剩余壽命天數(shù)。

對(duì)于新盤,預(yù)估壽命應(yīng)大于8年,否則應(yīng)分析寫入數(shù)據(jù)量是否偏大,需要優(yōu)化應(yīng)用程序并考慮加大SSD容量??紤]到換貨周期,建議預(yù)估剩余壽命低于90天時(shí)告警。

4結(jié)語(yǔ)

本文介紹了固態(tài)硬盤SSD的原理和相關(guān)技術(shù)概念,重點(diǎn)討論了SSD的性能和壽命相關(guān)的核心技術(shù)。通過(guò)分析一起典型的變電站自動(dòng)化設(shè)備SSD壽命相關(guān)的故障案例,指出緩存機(jī)制有助于提升SSD壽命,不恰當(dāng)?shù)能浖褂脮?huì)加速SSD的老化。

最后,本文提出了自動(dòng)化設(shè)備的SSD在線監(jiān)測(cè)方案,從預(yù)留容量、讀寫速度、預(yù)估壽命三個(gè)方面進(jìn)行狀態(tài)監(jiān)測(cè),為應(yīng)用SSD存儲(chǔ)的自動(dòng)化設(shè)備的穩(wěn)定可靠運(yùn)行提供技術(shù)保障。

本文的研究?jī)?nèi)容可為變電站自動(dòng)化設(shè)備合理使用SSD提供有益的參考。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉