摘要:核心機房UPS為重要負載供電,不容忽視。文章介紹了UPS輸出負載短路的后果及解決方案;結合案例說明維護中要重視零線的檢查;UPS零地電壓產生的原因及解決方案;UPS蓄電池安裝,需要注意的問題;UPS電容爆炸的原因及解決方案,并分析了電容爆炸幾種不同現象的原因。
核心機房UPS為計費系統(tǒng)、IDC設備、重要金融用戶設備、網管終端等重要負載供電,一旦出現事故影響很大。近年來,各運營商都出現過因UPS導致的系統(tǒng)癱瘓事故。筆者經多年的工作實踐總結了減少核心機房UPS事故需要注意的幾個問題。
?。盪PS輸出負載短路問題
UPS 輸出負載短路百分之九十以上會導致UPS 系統(tǒng)出現輸出停電或閃斷故障,從而導致所接的重要設備癱瘓。UPS 輸出負載短路時,不管單機、主從、并機,還是雙母線系統(tǒng)都不能保證負載不斷電。以目前最安全可靠的UPS 并機雙母線冗余供電系統(tǒng)為例,如圖1。
圖1 UPS并機雙母線冗余供電系統(tǒng)
圖中4臺UPS 每2臺1+1 帶并機柜并機提供雙母線供電,UPS1-1和UPS1-2通過并機柜并機構成系統(tǒng)一,UPS2-1 和UPS2-2通過并機柜并機構成系統(tǒng)二。正常情況下,系統(tǒng)一與系統(tǒng)二分別帶自己的負載。
系統(tǒng)一經UPS1輸出柜和靜態(tài)轉換開關STS1 帶負載,系統(tǒng)二經UPS2輸出柜和靜態(tài)轉換開關STS2帶負載,STS1 設定1路優(yōu)先導通,STS2設定為2路優(yōu)先導通。當其中一個系統(tǒng)供電母線上的任何設備故障時,其負載可經靜態(tài)轉換開關切換至另一個系統(tǒng)供電。
為了保證兩套系統(tǒng)可以同頻率、同相位跟蹤,還可以通過負載總線同步跟蹤控制器保證切換時電源在波形和相位上是連續(xù)的。對多數故障,這種系統(tǒng)都沒有問題,但還是不能解決輸出負載短路問題。這是因為短路相當于過載,切換到系統(tǒng)2,系統(tǒng)2也會過載宕機,導致負載斷電。
實際工作中發(fā)生輸出短路的可能性其實很大。現在很多運營商核心機房的UPS 系統(tǒng)是并機方式,2臺UPS 并機通過一個UPS 配電柜/配電箱給機房內所有的數據、網管、計費設備供電。從這個主UPS 配電柜到各負載還有可能經過若干個配電柜、配電箱、插座。其中任何一個環(huán)節(jié)出現短路故障,都有可能導致全系統(tǒng)斷電。另外不同運營商,不同地市,各專業(yè)之間的維護界面不盡相同。有的是所有電源都由動力專業(yè)維護;有的是UPS 主配電柜以外歸其它專業(yè)維護,UPS 主配電柜及以內歸動力專業(yè)維護。其它專業(yè)在動力技能方面可能有欠缺,存在很多不確定性,有發(fā)生短路的可能。UPS 都是優(yōu)先保護自身設備,不同廠家設計理念不同,輸出短路時有的UPS 不轉旁路,直接關掉逆變器宕機;有的轉旁路,但會頂掉空開,造成小面積停電。筆者遇到過一次,兩臺30kVA UPS 并機,安裝調試時由于施工人員操作不慎,設備端的UPS 輸出配電柜母排短路,兩臺UPS 逆變器都停止工作,也沒有轉旁路,只有斷開再關閉市電輸入開關,重新開機才恢復正常。
如何避免UPS 輸出負載短路導致系統(tǒng)宕機呢?
目前,設備制造廠商已將多數重要的網絡通信設備制作成具有雙電源輸入特性的設備。有2個交流電源接口,可以接2路交流電,內部再通過2個交流/直流轉換模塊轉換成直流電,并聯給設備供電,如圖2。
圖2雙路輸入供電方式
但實際工作中,一般只用了1個交流電源接口,或者最多用一根導線并接到第二個電源接口。這樣只解決了交流/直流轉換模塊的冗余保護,對電源線意外斷開或是輸出短路則無能為力。為了最大限度地發(fā)揮雙電源輸入設備的技術潛力,避免UPS 輸出短路導致系統(tǒng)宕機,保證重要設備供電安全,最好的解決辦法是用兩套雙母線并機系統(tǒng),分別給重要設備的2個電源端口供電。這樣既解決了電纜冗余,又解決了輸出短路問題,雖然建設成本高了一些,但安全性大大提高,對重要設備還是值得的。
?。擦憔€問題
零線問題是維護中很容易忽視的一個問題,有可能導致嚴重事故,結合一個案例說明此問題。
一個無人值守關口局在某寫字樓八樓,一樓營業(yè)廳從八樓關口局交流配電柜引電,UPS 也從交流配電柜引電,UPS 輸出到一個UPS 配電箱再給一些計費、網管等設備供電。故障現象是冬季UPS 連續(xù)幾天晚上12點左右斷電,UPS 顯示“輸出短路”,負載掉電,到現場重起UPS 后恢復正常。最后發(fā)現是以下2個原因:一是一樓營業(yè)廳門衛(wèi)晚上用幾個單相電暖器,并且接到了同一相交流電上,導致三相不平衡,由于零線電流是三相電流的矢量和,不平衡導致零線電流過大。
從主交流配電柜測零線電流,白天很正常,晚上用電暖器時測約20A。二是UPS 配電箱的零線排上幾個設備的零線螺絲松動。零線虛接再加上零線電流過大導致打火,UPS 判斷為“輸出短路”從而宕機。緊固零線,拆除電暖器后故障排除。所以在維護中要特別注意零線的檢查,從UPS 輸出到用電負載的整個供電路徑上的零線都要定期檢查緊固。
3UPS 的接地問題
UPS 的接地也是一個比較容易被忽略的問題。
當UPS 的負載不對稱,或UPS 帶有非線性負載時,中性線中就會有電流流過,在中性線上產生壓降引起中線和地線之間的電壓差通常稱為“零地電壓”。中性線電流越大、負載距離越遠、中性線導線截面越小,則“零地電壓”就越大。有些靈敏負載對“零地電壓”要求很高,例如“零地電壓”大于1V,有些服務器就不能正常工作。
這是因為一般核心機房接地系統(tǒng)都是UPS 輸出中性線和負載中性線固定接到市電電源的中性線上,市電電源的中性線在低壓進線柜中連接到接地極上,UPS 輸出和負載的中性線與市電的中性線沒有任何的隔離。核心機房中交流電纜很多,每一根電纜都含有大量的電磁干擾,所有的這些電纜被捆扎在一起走長線,使得這些高頻干擾互相串擾,高頻干擾電流在零線、地線上流過帶來了零地之間的壓降。
解決的辦法一是將UPS 的火線和零線、地線分開走線,兩者的距離應該保證在20?。悖硪陨希渌鼊恿﹄娎|也遠離UPS 零線。如果施工現場條件不允許,零線和地線要用鎧裝屏蔽電纜。但這種方法治標不治本,機房內設備變化,電磁干擾環(huán)境也隨之改變,零地電壓也會改變,不能徹底解決問題。二是在UPS 負載端加隔離變壓器,并將隔離后的零線接地,可以保證負載的零地電壓趨近于零,解決“零地電壓”問題效果最好。
4UPS蓄電池問題
UPS 蓄電池是一個容易出問題的環(huán)節(jié),由UPS蓄電池引發(fā)的事故占UPS總事故較大比重。這是因為UPS蓄電池一般是12V蓄電池,內部實際上是6只2V蓄電池串聯焊接構成,制作難度大,而且板柵,連接條比較薄,只要一個板柵出現問題,整只UPS 電池就有問題,故障率遠遠高于2V蓄電池,所以在安裝維護中要注意以下幾個問題。
?。ǎ保︰PS蓄電池最好用蓄電池架安裝,不要用蓄電池柜。一是便于通風散熱,UPS 蓄電池對溫度非常敏感,最佳環(huán)境溫度是20 ~25℃,溫度每升高10℃,蓄電池的壽命就會降低一倍。UPS蓄電池充放電過程中會釋放大量熱能,熱量散不出去,直接影響電池容量與壽命。二是便于維護測量。用蓄電池柜安裝,如果空間太小,巡檢時操作人員可能會因為操作不便,或視線問題導致操作工具短路或檢查不仔細忽略本應發(fā)現的故障隱患。有這樣一個案例:主從熱備份UPS 系統(tǒng),密封蓄電池柜(有通風孔),螺絲固定的面板拆卸不便,用螺絲刀拆才能打開。一次巡檢發(fā)現備機UPS 的蓄電池組中底層角落里有兩只蓄電池連接線松動,并且漏液。UPS 蓄電池是大電流放電,這種情況下如果恰好主機UPS 故障,備機UPS 蓄電池放電供給負載,后果嚴重,有可能著火甚至爆炸。
?。ǎ玻︰PS蓄電池連接線不要用開口銅鼻子,要用孔型銅鼻子,開口銅鼻子不如孔型壓接牢固,容易脫落;連接線要用軟銅線,不要用硬銅線,硬銅線有時由于吃著勁,當時緊固了,時間長了會松動,造成端子處連接不良,在一定的條件下可能端子處拉弧或熱量*,最終導致著火;連接線要用長度一致的同一規(guī)格導線,否則電阻不一致,長期使用,會發(fā)生充電時有的UPS 蓄電池已充滿,有的UPS 蓄電池還沒充滿,從而導致已充滿的UPS 蓄電池過充,水分從安全閥溢出,電解液濃度變大,長時間會腐蝕極板,導致蓄電池一致性變差。
?。ǎ常┯捎谛铍姵睾苤兀惭b時要用正確的方法搬運和吊裝蓄電池,不能用鉤子或螺絲刀直接勾住蓄電池外露極柱搬卸蓄電池。極柱與極板是焊接的,這樣會拉傷蓄電池端子,嚴重時可能導致著火。另外蓄電池組上輸出的電纜,不要直接從電池端子拉至主設備,中間需要有接線盒或轉接端子,否則蓄電池端子上長期承受拉力,可能破壞蓄電池內部的連接。
?。礥PS 電容爆炸問題
?。?1UPS 電容爆炸的原因
UPS 的電容一般是指其內部的直流濾波電容和儲能電容及輸入輸出交流濾波電容。UPS 電容爆炸一般是指直流濾波電容和儲能電容,它通常選用容量較大的電解電容,電容爆炸一般是因為耐壓問題造成的,其本質原因有如下二個。
5.1.1內部電介質絕緣強度下降導致電容擊穿
(1)電容本身質量問題。近年來,一些廠家為了降低產品售價,提高產品中標的競爭力,選用了壽命較短的直流濾波電容,這也是導致目前發(fā)生電容爆炸故障的事例日益增多的主要原因。
?。ǎ玻囟?。電容器的使用壽命隨溫度的增加而減小,溫度加速介質與電解液化學反應使介質隨時間退化,耐壓值下降。另外溫高還會導致漏電流增大。在直流正向電壓施加于電容器一段時間后仍有一個微小電流持續(xù)從正電極流向負電極,這個微小的電流即稱為漏電流。漏電流越小表明電介質制作得越精良,漏電流的特性是隨著溫度的升高越來越大。為防止電解液蒸發(fā),電容一般采用密封結構,散熱性較差。如果熱量不能及時排出去,器件內部溫度上升會很快,導致漏電流的進一步增大;根據電流熱效應,漏電流增大又會導致溫度上升,熱量積累惡性循環(huán),使電容內部電解液沸騰和汽化,氣壓迅速增大到外殼無法承受時,就會爆炸。如果防護設計的不好,電解液噴濺到電路板上,檢測控制電路受損還會導致更加嚴重的后果。
電容溫度高的原因一是機房環(huán)境較差,長期不維護造成UPS 內部積塵過多,散熱不良。二是空調送/回風通道設計不好,UPS 周圍環(huán)境溫度較高。解決的方法為每年對UPS 做一次內部除塵;做好空調設計,避免局部高溫;采用遠紅外成像儀、遠紅外測溫儀等檢測儀對濾波電容的異常溫升進行檢測,及時更換有潛在故障隱患的電容,防患于未然。
5.1.2外部電壓超過電容的耐壓值
UPS 內部的儲能直流電容耐壓值一般為直流450~500V,以POWERWARE9150/930510kVA UPS為例,其內部直流母線電壓為400VDC,而直流電解電容的耐壓值是450VDC。UPS 中的相控整流器控制著輸出直流電壓的高低,UPS使用年限越長,相控整流器電路器件參數越老化,造成UPS 內部的直流400V電壓不再穩(wěn)定。市電波動時,會造成UPS 內部400V直流電壓波動,波動的電壓幅值很可能會超過450V,造成直流電解電容過壓,再加上電容長期使用耐壓性能下降,就會發(fā)生爆裂。解決的方法是選用大品牌UPS 設備,把好產品質量關;到達報廢年限的UPS 堅決報廢(一般UPS 壽命是5 ~7年,建議5年報廢);使用超過3 年的UPS 要定期檢查內部的電容,看看有沒有漏液、鼓包,容量是不是已經下降到其容量誤差下限等,這些是爆炸的前兆。
5.2UPS 電容爆炸的幾種可能現象及分析
理論上,并機系統(tǒng)中一臺UPS 故障,故障UPS 應自動退出系統(tǒng),其它正常工作,但現實中電容爆炸時卻不一定是這樣。統(tǒng)計資料顯示一旦發(fā)生電容爆炸故障,90%以上的幾率會導致并機系統(tǒng)出現輸出停電或閃斷故障(中斷時間大于8~20ms?。?,從而導致負載癱瘓幾十分鐘甚至幾小時。
?。ǎ保┏税l(fā)生電容爆炸的那臺UPS 單機處于逆變器自動關機狀態(tài)之外,其余各臺UPS 似乎都處于“正常的”逆變器電源供電狀態(tài)。這是因為并機UPS 系統(tǒng)中一臺設備逆變器發(fā)生故障導致系統(tǒng)輸出電壓波動,或是輸出交流電壓中含有很高的直流成分電壓,或是拉低了系統(tǒng)輸出電壓,從而影響到負載。
?。ǎ玻┏税l(fā)生電容爆炸的那臺UPS 單機處于逆變器自動關機狀態(tài),其它UPS 的輸入開關或UPS 并機系統(tǒng)的總輸入開關跳閘,UPS 處于電池組提供能量的逆變器供電狀態(tài)。這種情況主要原因是電容爆炸的UPS 的逆變器發(fā)生了內部短路故障,由于逆變器并聯,導致其它UPS 逆變器輸出瞬間短路,輸出電流瞬間增大,而這些電流不是供給負載,而是供給內部短路的UPS,從而造成正常的UPS 瞬間過載,進而導致相關輸入開關跳閘。
?。ǎ常?ldquo;N+1 ”UPS 并機系統(tǒng)中各臺UPS 的輸入、輸出配電柜中的開關都配置為斷路器開關。一臺UPS 的濾波電容爆炸,其余UPS 的輸入、輸出開關全都跳閘。這是因為交流輸入濾波電容爆炸造成市電小范圍供電環(huán)境惡化。UPS 都有輸入濾波器,該濾波器都有電感線圈,輸入市電在瞬時發(fā)生突變,相當于感性負載兩端電壓突變,從而產生反向電動勢,沖擊相關的斷路器,斷路器都有過壓保護和過流保護功能,開關全都跳閘。
(4)并機系統(tǒng)中除了發(fā)生電容爆炸的那臺UPS 逆變器自動關機,其余UPS 均處于“正常的”逆變器供電狀態(tài),負載正常工作的情況。這種僥幸情況不會超過10?。ィ话闶墙涣鬏斎腚娙荼ɑ蛘咧绷麟娊怆娙荼]有影響到檢測控制電路。
6結束語
核心機房UPS 維護難度大,故障率高,發(fā)生事故影響大。為了減少核心機房UPS 事故,需要深入分析其發(fā)生事故的各種可能原因,做好基礎維護工作,將事故隱患消除在萌芽狀態(tài)。