電源協(xié)會韓林談諧波治理:化解供電系統(tǒng)隱形故障
中國IDC產業(yè)聯(lián)盟訊 為了提升數(shù)據(jù)中心行業(yè)對安全管控系統(tǒng)更加全面的認識及技術的發(fā)展,加速推廣電能質量管理系統(tǒng)的應用標準。中國數(shù)據(jù)中心產業(yè)發(fā)展聯(lián)盟特于6月24日在京具舉辦“2011中國數(shù)據(jù)中心動力安全能效管理趨勢研討會” ,邀請國內眾多資深專家就數(shù)據(jù)中心安全運維和電能質量管理等議題進行深入交流和探討。
中國IDC產業(yè)聯(lián)盟網作為中國數(shù)據(jù)中心產業(yè)發(fā)展聯(lián)盟的官方指定媒體,對此次大會進行全程深入報道。
中國電源協(xié)會高級工程師韓林在演講中指出,數(shù)據(jù)中心的供電系統(tǒng)結構是以目前是以UPS電源為核心的低壓交流供電系統(tǒng),包括輸入電源系統(tǒng)以及以UPS為核心,幫助UPS輸入、輸出配電一直到負載之前的供電系統(tǒng),包括配電、配電柜、電壓其、電纜等。
供電系統(tǒng)的諧波仍然是一個隱形故障,因為在關聯(lián)系統(tǒng)當中存在兩方面的諧波源,一個就是負載的開關電源,雖然05年以后有新的IDC標準,類似于開關電源模塊的小容量電源產品,它的諧波不能夠超過20%。但是負載的開關電源設備都是一些單向負載,含有一定量的諧波。
以下為中國電源協(xié)會高級工程師韓林演講全文:
韓林:各位領導、各位專家,大家下午好!今天非常高興有這樣一個機會跟大家共同探討有關數(shù)據(jù)中心動力安全管理這樣一個課題。
目前來講,數(shù)據(jù)中心當中存在的問題也比較多,特別是在電源系統(tǒng)方面,由于咱們的時間也比較緊張,所以我就選擇兩個話題跟大家簡單的探討一下。第一個問題,數(shù)據(jù)中心系統(tǒng)目前的現(xiàn)狀,特別是電源系統(tǒng)目前存在的發(fā)展趨勢;二是供電系統(tǒng)當中存在的問題,也把它羅列了出來跟大家共同交流和探討。
數(shù)據(jù)中心國外從1997年開始大量數(shù)據(jù)中心的建設,國內是從2000年開始,但是數(shù)據(jù)中心的建設過去一直沒有標準。大家知道,2005年頒布了美國ANSI/TIA-942的標準,,我們國家08年有一個GB50174的標準,有了國內、國外更多的規(guī)范,可以獲得一些指導性的意見。
經濟技術的發(fā)展促進了數(shù)據(jù)中心事業(yè)的發(fā)展,發(fā)展的速度也是非??欤写笮偷臄?shù)據(jù)中心越建越多,每年都可以聽到有新的大型數(shù)據(jù)中心建設在開始,比如像天津的超算,深圳的超算,還有濟南的超算這樣一些國家大型數(shù)據(jù)中心。還包括像前些日子聽到的,在重慶要建一個10平方公里的云計算中心。像這樣一些大型數(shù)據(jù)中心的發(fā)展,說明國內數(shù)據(jù)中心事業(yè)的發(fā)展的確有一個突飛猛進的發(fā)展。
數(shù)據(jù)中心成為新經濟的一項標志,從各行各業(yè),無論是工農業(yè)、企業(yè)、商業(yè),包括國防一直到人們的日常生活當中,都受國際互聯(lián)網的應用,同時它的背后就是數(shù)據(jù)中心在強有力的支持。剛才很多專家已經談到了這方面的論點。
打造綠色數(shù)據(jù)中心已經成為時代的一個潮流,節(jié)能、低碳、環(huán)保是我們數(shù)據(jù)中心發(fā)展的一個方向,安全、可靠、可用、可信是一個基礎,數(shù)據(jù)中心的建設不可能離開這個基礎而單純的只是向節(jié)能環(huán)保這個方向去努力。
科學管理在數(shù)據(jù)中心的應用方面的確還是一個新的課題,建設一個數(shù)據(jù)中心有相應的一些標準、規(guī)范,大家很容易去理解它,并且有一些相應的數(shù)據(jù)中心的建設部門、供應商,他們可以提供相當完整的基礎設施方案。但是真正把一個數(shù)據(jù)中心用好,能夠把它管理好,確實是我們遇到的一個比較新的課題。數(shù)據(jù)中心的應用包括運行維護、能效管理、人員培訓,還有專業(yè)化的服務。
數(shù)據(jù)中心的供電系統(tǒng)結構是以目前是以UPS電源為核心的低壓交流供電系統(tǒng),包括輸入電源系統(tǒng)以及以UPS為核心,幫助UPS輸入、輸出配電一直到負載之前的供電系統(tǒng),包括配電、配電柜、電壓其、電纜等。
在數(shù)據(jù)中心當中,目前的供電系統(tǒng)應用2N也好,N+1也好,這樣的系統(tǒng)的應用是非常多的。建立兩套獨立的UPS系統(tǒng),形成UPS。通過UPS輸出的配電達到負載的列頭柜,進入每個機架。這是最常見也是最普及的供電模式。對于一些比較重要的負載來講,還可以通過STS,通過負載列頭柜來實現(xiàn)二次性的雙母線的負荷,也就是把原來的雙母線變成一套與原來不基本一樣的復合雙母線為一些新的負載去配電。比如金融行業(yè),有一些生產性的負載,都是采用了區(qū)域3、區(qū)域4這樣的供電諾士。STS的系統(tǒng)來講,它的可靠性、可用性以及可維護性都會得到一個比較好的發(fā)展。當系統(tǒng)容量增大的時候,我們也可以在系統(tǒng)的建設上預留一定的安裝接口。
供電系統(tǒng)設計和配置中存在一些問題,有一些和后期的運行管理有密切關系。一是供電系統(tǒng)可靠性、可用性存在的問題:負載對供電可用性的要求越來越高,可用性按照我們的理解,負載計算機可以正常運行的時間與總時間之比,這個正常運行時間里面應該包含有降級使用的時間。什么叫降級?比如說UPS是2+1冗余的,換了一臺,現(xiàn)在沒有冗余了,但是你的計算機依然能夠正常供電的,這種就是屬于降級使用。降級使用的時間應該在可用時間或者正常運行時間之內,如果要不把它包含在可用時間之內,就會帶來很多將來在運維管理方面的誤導或者觀念上的混淆。
負載對供電質量的要求降低,為什么?是因為目前來講,我們的計算機負載輸入范圍變寬了,比如說電壓,從原來5%,現(xiàn)在放寬到10%,頻率從原來的1%,現(xiàn)在也放寬了。
負載對供電連續(xù)性的要求有所提高,但是對于供電瞬間的間斷時間要求也是降低了。剛才很多專家都已經講到,從CBEMA這條曲線規(guī)定計算機的供電電壓等于零的時間是10個毫米,后來后來的曲線公布出來的電壓等于零的時間已經放寬到20毫米。所以計算機對供電要求不是很苛刻。
作為電源系統(tǒng)來講,如果單純來提高某一個設備或者某一個裝置的可靠性,現(xiàn)在來講已經很難了。大家可以理解,比如斷路器我們可以選擇一些比較好、比較知名的品牌,但是你要讓這個斷路器各項性能能夠再提升一個臺階,它的機械強度、短路電流的承受能力等等再要增加的話很難。UPS也一樣,發(fā)展到現(xiàn)階段,如果讓UPS的MTBF再成倍的提高也不可能。在這種情況下,改變設備可靠性已經比較難,所以如果要想使負載獲得更高的可用性,只有從系統(tǒng)架構上去提高它的可用性。
經常大家說各個廠家的設備都差不多,這也說明我們的產品已經成熟化,市場化,甚至就是一個通用設備,跟電視機一樣,你的電視機可以接錄像機,可以接數(shù)碼相機。
當電源設備仍然占據(jù)一定比例,成為單路徑故障點。所以在這方面還有可以進一步改進的。雙電源供電系統(tǒng)日趨成熟,但是配置結構相對復雜,不光是設備的種類多,而且包括供應商也很多,這個時候可能就會出現(xiàn)眾口紛紜的情況。這個“口”不光五流傳,大家有一個口碑,而且各個供應商之間的接口也是非常重要值得我們探索和深思的。[!--empirenews.page--]
我們在這提出來一些問題,并不是說一個專門的研討會去研討它的技術,只能說我們去提供一種解決的方向。比如說我們可以通過冗余來改變系統(tǒng)的可維護性,一個系統(tǒng)不可能不對它進行維護,任何設備、電纜、斷路器、UPS、ATS都是需要維護的。
用雙總線來增強故障容錯的能力,避免天災人禍。比如像很多重要的行業(yè),自從四川大地震以后,包括日本地震以后,要求UPS也拿去做震動測試,震多長時間,按照多少級來震,這些實際上是對產品品質的監(jiān)測,但是對于系統(tǒng)來講,我們是一個基礎設施,所以還是以雙總線的形式去做是一個比較好的選擇。
模塊化,大家有的時候都是考慮到UPS產品自身的模塊化,認為UPS是有一個一個的抽屜插入的。這個觀念比較局限化,在大的系統(tǒng)里面,不可能采用一個10千瓦、20千瓦的模塊去拼接一個計算機系統(tǒng)?,F(xiàn)在經常遇到的中大型數(shù)據(jù)中心變壓器2500,UPS2400,這樣一個大的系統(tǒng)要用10千瓦、20千瓦去拼的話,節(jié)點就太多了。
可管理性,剛才大家也提到了很多,包括一些新的設備和儀器,它不僅是對于設備、系統(tǒng)的管理,可管理性應該還包括人員的管理。在942當中,對于人員的培訓、管理、服務提出了很明確的要求,但是大家往往看的比較多的、關注比較多的是空調應該怎么配,UPS怎么配,接地怎么做,但是真正對于人員的管理、對于人員的培訓重視的程度不夠。所以我們要避免一些人為的故障,預見一些問題的隱患,其實跟人員的培訓還是有密切關系的。
系統(tǒng)的集成化,提高系統(tǒng)的可用性。我們所說的系統(tǒng)集成化并不是說所有設備的羅列,而是希望從供電設備的制造商和渠道商來講,能夠做到統(tǒng)一化。有的數(shù)據(jù)中心可能為了平衡關系,空調是一個廠家,UPS一個廠家,甚至諧波治理是另外一個廠家,有負載電路柜的供應商等等,一套電源系統(tǒng)結果弄的十幾個供應商,出了問題之后,大家就該相互推諉了。在工程設計和施工的規(guī)范化,采用的是比較專一的供應商的話,工程設計和施工方面有一個按照他比較規(guī)范的行為去做這樣的事情。
設備和子系統(tǒng)的集中管理,前面專家講的比較多,在這就不占用大家時間了。
供電系統(tǒng)的諧波仍然是一個隱形故障的問題,因為在關聯(lián)系統(tǒng)當中存在兩方面的諧波源,一個就是負載的開關電源,雖然05年以后有新的IDC標準,類似于開關電源模塊的小容量電源產品,它的諧波不能夠超過20%。但是負載的開關電源設備都是一些單向負載,含有一定量的諧波。這些新的特性也要求UPS有一些相應的變化。
UPS主要的諧波來自整流器,特別是可控硅整流。諧波對于電纜、供電系統(tǒng)有很大的危害。由于電源系統(tǒng)當中諧波的存在,對于接地系統(tǒng)也提出非常苛刻的要求。大家都知道,零地電壓的問題,中性線電流的問題,這些方面都有一些相應的問題。
解決的方向,如果是UPS本身諧波高,最好輸入諧波含量低的UPS。比如,IGBT-PFC整流的無變壓器UPS。選擇按照“高負載功率因數(shù)”設計的UPS,例如06年以后設計生產的高頻機UPS。選擇運行效率更高的UPS,例如互動式(VI或FD)UPS。隨著數(shù)據(jù)中心的發(fā)展,計算機負載對于供電可容性要求高,對于輸入放寬了,所以互動式UPS才有可能重新進入到供電中心。從綠色、能源角度來講,互動式UPS更是發(fā)揮了它的高效率。
消除零地電壓也是電源系統(tǒng)特別重要的一個問題,但是我們覺得零地電壓在以往的電源系統(tǒng)建設當中有一些誤導。現(xiàn)在的開關電源模塊是電氣完全隔離,從交流輸出到直流輸出,從220V交流輸入一直到后面計算機的輸出,中間都有高頻或者耐沖式的變壓器進行隔離。所以開關電源或者說CPU的對于交流電源系統(tǒng)的中線已經沒有這種依賴性了,CPU對于零地電壓并不敏感。
通訊方式的改變,也是對零地電壓不是那么敏感了。過去都是采用計算機是點對點的方式,點對點應用最多的就是串行或者并行,串行信號或者并行信號的傳輸方式現(xiàn)在已經以以太網、光纜傳輸這些東西取代,所以對于直流地已經不再依賴。新的服務器上面幾乎沒有一個明確的標注點說這個就是直流地,我們都看不到,在這種情況下,零地電壓對計算機負載并不敏感。
再一個比較誤導人的是,零地電壓上升都是UPS造成的,實際上UPS并不是零地電壓上升的元兇。
隔離變壓器,它可以比較好的降低零地電壓,特別是重新組成的零線系統(tǒng),使得零地電壓比較低,但是我們也要探討加這個隔離變壓器在你的系統(tǒng)當中對于可用性的提高有沒有必要值得商討。因為變壓器的引入帶來了很多問題,比如說變壓器的勵磁涌流的問題,它對于發(fā)電機的沖擊是一個不可忽視的問題,包括斷路器選擇性的配比,都是非常重要的問題。還有由于安裝了變壓器,假如下線負載短路,短路電流會造成變壓器二次電壓的跌落問題,如果跌落比較多,超過10%或者超過15%了,很可能這個變壓器下面所有的負載都要停電,因為變壓器的電壓過低了。
供電系統(tǒng)建造成本和能源效率問題,一個是PUE,一個是TCO。解決建造成本的問題,包括提高設備利用率。不要過度規(guī)劃,數(shù)據(jù)中心的負載量、電力的評估、電力的估算、空調制冷的估算往往會造成過度規(guī)劃。剛才很多專家也提到了,負載率那么低,你的效率不可能高,再加上過度規(guī)劃,實際負載率遠遠低于設備的負載率,這個時候對于電器設備來講,對于UPS來講,也希望UPS有智能化的休眠和喚醒功能。
系統(tǒng)運行、維護的難度問題。供電系統(tǒng)日趨復雜,沒有正常的維修保養(yǎng)時間,這是后期的運行和維護保養(yǎng)中經常會遇到的一個問題。一個2N的系統(tǒng)或者2N+1的系統(tǒng)本身是可以同時維護的,但是系統(tǒng)的管理人員或者運維的制度不允許或者不能夠給你提供預防性的維護時間,你不停電,沒問題,你可以幫忙測測連接有沒有問題,但是一到了設備,你的設備太臟了,我得清掃,清掃肯定得停電,不停電誰敢去清掃?再說吹出來的灰塵本身含有一定的導電顆粒的話,也會故障。把一個可以停電維修的系統(tǒng)不給它提供預防性的維護時間。還有提到不允許轉旁路,包括在一些用戶現(xiàn)場看到過的規(guī)章,雙電源負載不允許一路供電。還有不敢進行電池放電測試的,多少時間做一次?我們一年也不做一次。為什么不敢動?動了怕電源出問題。這是運維管理者概念上的偏差。易損部件不愿意更換,在設備里面,你要想獲得一個系統(tǒng)的高可用性,對設備的維護,更換一些易損件也是必須的。[!--empirenews.page--]
系統(tǒng)要求提高運行維護水平越來越高,但是很多數(shù)據(jù)中心缺乏一個系統(tǒng)化的專業(yè)培訓。供應商多,工程界面多,出了故障以后,大家相互推諉,說這個不是我管的,這個你找電池廠商,那個你找發(fā)電機ATS廠商等等。
在數(shù)據(jù)中心規(guī)劃設計的時候,事實上不管是設計部門也好還是設計人員也好,對于系統(tǒng)設計缺乏一個全面保護的規(guī)劃和設計。比如說電源系統(tǒng)設計的,我就管變壓器,我就管空調多少容量,至于每一臺UPS輸入斷路器怎么診定,輸出斷路器真怎么診定,他是沒有這個設計的,設計人員拿不出一個系統(tǒng)的方案,拿出來的仍然是零零碎碎或者安全以往經驗做出來的評估。假如說12脈沖的UPS你應該怎么整這個斷路器。規(guī)律也很簡單,大家真正理解它了,設計人員也能做好這個工作的。
缺乏第三方認證和評估,在國內曾經有人問我,你知道咱們國家哪能做數(shù)據(jù)中心等級的評估嗎?我說不知道,還真沒有一個國家的權威機構,哪怕是民間的機構也可以。大家對于數(shù)據(jù)中心的建設,說我花了這么多錢,到底我是不是按照A級的機房標準來建設的呢?到底我哪不夠A級,哪是已經超過了A級,這種真正的第三方認證和評估,對于整個數(shù)據(jù)中心的管理來講仍然是比較的困難。
解決方向,對于人員的管理和對于設備的管理兩方面應該是齊頭并進的。剛才也提到了培訓,專業(yè)培訓大家最好能夠消除一個誤會,我們的專業(yè)培訓不應該是某一設備的維修培訓,因為我們的運維人員針對的是管理一個整個的系統(tǒng),不管你的電源系統(tǒng)也好還是空調系統(tǒng)也好,還是安防系統(tǒng)也好,對你這個系統(tǒng)的來龍去脈,比如說電源系統(tǒng)從變壓器、發(fā)電機一直到列頭柜甚至到列頭柜的配電單元,你是不是都很清楚它的容量,知道它的利用率,知道它有什么毛病,知道它有故障的時候我去找誰,很多東西都不知道。一講培訓,就是這個設備UPS應該怎么開關機,怎么來操作,這些不是說沒有必要,但是我們不能把運維人員的培訓局限在原理培訓上。還包括演練,我聽說很多銀行每個月或者兩個月都有這樣一個演練,也是非常重要的。
應該選擇有資質的供應商,建立必要的專業(yè)化服務。設備的修理是設備廠家的事,但是管理這樣一個服務是我們運維人員或者數(shù)據(jù)中心管理者應該做的,只有通過你選擇合適的供應商,有誠信,經過一段時間的考驗,同時建立專業(yè)化的售后服務合同,才能真正做到24小時的現(xiàn)場響應和專業(yè)化的服務。
就簡單跟大家說這些。謝謝大家!