電源協(xié)會韓林談諧波治理:化解供電系統(tǒng)隱形故障
中國IDC產(chǎn)業(yè)聯(lián)盟訊 為了提升數(shù)據(jù)中心行業(yè)對安全管控系統(tǒng)更加全面的認(rèn)識及技術(shù)的發(fā)展,加速推廣電能質(zhì)量管理系統(tǒng)的應(yīng)用標(biāo)準(zhǔn)。中國數(shù)據(jù)中心產(chǎn)業(yè)發(fā)展聯(lián)盟特于6月24日在京具舉辦“2011中國數(shù)據(jù)中心動力安全能效管理趨勢研討會” ,邀請國內(nèi)眾多資深專家就數(shù)據(jù)中心安全運維和電能質(zhì)量管理等議題進行深入交流和探討。
中國IDC產(chǎn)業(yè)聯(lián)盟網(wǎng)作為中國數(shù)據(jù)中心產(chǎn)業(yè)發(fā)展聯(lián)盟的官方指定媒體,對此次大會進行全程深入報道。
中國電源協(xié)會高級工程師韓林在演講中指出,數(shù)據(jù)中心的供電系統(tǒng)結(jié)構(gòu)是以目前是以UPS電源為核心的低壓交流供電系統(tǒng),包括輸入電源系統(tǒng)以及以UPS為核心,幫助UPS輸入、輸出配電一直到負(fù)載之前的供電系統(tǒng),包括配電、配電柜、電壓其、電纜等。
供電系統(tǒng)的諧波仍然是一個隱形故障,因為在關(guān)聯(lián)系統(tǒng)當(dāng)中存在兩方面的諧波源,一個就是負(fù)載的開關(guān)電源,雖然05年以后有新的IDC標(biāo)準(zhǔn),類似于開關(guān)電源模塊的小容量電源產(chǎn)品,它的諧波不能夠超過20%。但是負(fù)載的開關(guān)電源設(shè)備都是一些單向負(fù)載,含有一定量的諧波。
以下為中國電源協(xié)會高級工程師韓林演講全文:
韓林:各位領(lǐng)導(dǎo)、各位專家,大家下午好!今天非常高興有這樣一個機會跟大家共同探討有關(guān)數(shù)據(jù)中心動力安全管理這樣一個課題。
目前來講,數(shù)據(jù)中心當(dāng)中存在的問題也比較多,特別是在電源系統(tǒng)方面,由于咱們的時間也比較緊張,所以我就選擇兩個話題跟大家簡單的探討一下。第一個問題,數(shù)據(jù)中心系統(tǒng)目前的現(xiàn)狀,特別是電源系統(tǒng)目前存在的發(fā)展趨勢;二是供電系統(tǒng)當(dāng)中存在的問題,也把它羅列了出來跟大家共同交流和探討。
數(shù)據(jù)中心國外從1997年開始大量數(shù)據(jù)中心的建設(shè),國內(nèi)是從2000年開始,但是數(shù)據(jù)中心的建設(shè)過去一直沒有標(biāo)準(zhǔn)。大家知道,2005年頒布了美國ANSI/TIA-942的標(biāo)準(zhǔn),,我們國家08年有一個GB50174的標(biāo)準(zhǔn),有了國內(nèi)、國外更多的規(guī)范,可以獲得一些指導(dǎo)性的意見。
經(jīng)濟技術(shù)的發(fā)展促進了數(shù)據(jù)中心事業(yè)的發(fā)展,發(fā)展的速度也是非???,包中大型的數(shù)據(jù)中心越建越多,每年都可以聽到有新的大型數(shù)據(jù)中心建設(shè)在開始,比如像天津的超算,深圳的超算,還有濟南的超算這樣一些國家大型數(shù)據(jù)中心。還包括像前些日子聽到的,在重慶要建一個10平方公里的云計算中心。像這樣一些大型數(shù)據(jù)中心的發(fā)展,說明國內(nèi)數(shù)據(jù)中心事業(yè)的發(fā)展的確有一個突飛猛進的發(fā)展。
數(shù)據(jù)中心成為新經(jīng)濟的一項標(biāo)志,從各行各業(yè),無論是工農(nóng)業(yè)、企業(yè)、商業(yè),包括國防一直到人們的日常生活當(dāng)中,都受國際互聯(lián)網(wǎng)的應(yīng)用,同時它的背后就是數(shù)據(jù)中心在強有力的支持。剛才很多專家已經(jīng)談到了這方面的論點。
打造綠色數(shù)據(jù)中心已經(jīng)成為時代的一個潮流,節(jié)能、低碳、環(huán)保是我們數(shù)據(jù)中心發(fā)展的一個方向,安全、可靠、可用、可信是一個基礎(chǔ),數(shù)據(jù)中心的建設(shè)不可能離開這個基礎(chǔ)而單純的只是向節(jié)能環(huán)保這個方向去努力。
科學(xué)管理在數(shù)據(jù)中心的應(yīng)用方面的確還是一個新的課題,建設(shè)一個數(shù)據(jù)中心有相應(yīng)的一些標(biāo)準(zhǔn)、規(guī)范,大家很容易去理解它,并且有一些相應(yīng)的數(shù)據(jù)中心的建設(shè)部門、供應(yīng)商,他們可以提供相當(dāng)完整的基礎(chǔ)設(shè)施方案。但是真正把一個數(shù)據(jù)中心用好,能夠把它管理好,確實是我們遇到的一個比較新的課題。數(shù)據(jù)中心的應(yīng)用包括運行維護、能效管理、人員培訓(xùn),還有專業(yè)化的服務(wù)。
數(shù)據(jù)中心的供電系統(tǒng)結(jié)構(gòu)是以目前是以UPS電源為核心的低壓交流供電系統(tǒng),包括輸入電源系統(tǒng)以及以UPS為核心,幫助UPS輸入、輸出配電一直到負(fù)載之前的供電系統(tǒng),包括配電、配電柜、電壓其、電纜等。
在數(shù)據(jù)中心當(dāng)中,目前的供電系統(tǒng)應(yīng)用2N也好,N+1也好,這樣的系統(tǒng)的應(yīng)用是非常多的。建立兩套獨立的UPS系統(tǒng),形成UPS。通過UPS輸出的配電達到負(fù)載的列頭柜,進入每個機架。這是最常見也是最普及的供電模式。對于一些比較重要的負(fù)載來講,還可以通過STS,通過負(fù)載列頭柜來實現(xiàn)二次性的雙母線的負(fù)荷,也就是把原來的雙母線變成一套與原來不基本一樣的復(fù)合雙母線為一些新的負(fù)載去配電。比如金融行業(yè),有一些生產(chǎn)性的負(fù)載,都是采用了區(qū)域3、區(qū)域4這樣的供電諾士。STS的系統(tǒng)來講,它的可靠性、可用性以及可維護性都會得到一個比較好的發(fā)展。當(dāng)系統(tǒng)容量增大的時候,我們也可以在系統(tǒng)的建設(shè)上預(yù)留一定的安裝接口。
供電系統(tǒng)設(shè)計和配置中存在一些問題,有一些和后期的運行管理有密切關(guān)系。一是供電系統(tǒng)可靠性、可用性存在的問題:負(fù)載對供電可用性的要求越來越高,可用性按照我們的理解,負(fù)載計算機可以正常運行的時間與總時間之比,這個正常運行時間里面應(yīng)該包含有降級使用的時間。什么叫降級?比如說UPS是2+1冗余的,換了一臺,現(xiàn)在沒有冗余了,但是你的計算機依然能夠正常供電的,這種就是屬于降級使用。降級使用的時間應(yīng)該在可用時間或者正常運行時間之內(nèi),如果要不把它包含在可用時間之內(nèi),就會帶來很多將來在運維管理方面的誤導(dǎo)或者觀念上的混淆。
負(fù)載對供電質(zhì)量的要求降低,為什么?是因為目前來講,我們的計算機負(fù)載輸入范圍變寬了,比如說電壓,從原來5%,現(xiàn)在放寬到10%,頻率從原來的1%,現(xiàn)在也放寬了。
負(fù)載對供電連續(xù)性的要求有所提高,但是對于供電瞬間的間斷時間要求也是降低了。剛才很多專家都已經(jīng)講到,從CBEMA這條曲線規(guī)定計算機的供電電壓等于零的時間是10個毫米,后來后來的曲線公布出來的電壓等于零的時間已經(jīng)放寬到20毫米。所以計算機對供電要求不是很苛刻。
作為電源系統(tǒng)來講,如果單純來提高某一個設(shè)備或者某一個裝置的可靠性,現(xiàn)在來講已經(jīng)很難了。大家可以理解,比如斷路器我們可以選擇一些比較好、比較知名的品牌,但是你要讓這個斷路器各項性能能夠再提升一個臺階,它的機械強度、短路電流的承受能力等等再要增加的話很難。UPS也一樣,發(fā)展到現(xiàn)階段,如果讓UPS的MTBF再成倍的提高也不可能。在這種情況下,改變設(shè)備可靠性已經(jīng)比較難,所以如果要想使負(fù)載獲得更高的可用性,只有從系統(tǒng)架構(gòu)上去提高它的可用性。
經(jīng)常大家說各個廠家的設(shè)備都差不多,這也說明我們的產(chǎn)品已經(jīng)成熟化,市場化,甚至就是一個通用設(shè)備,跟電視機一樣,你的電視機可以接錄像機,可以接數(shù)碼相機。
當(dāng)電源設(shè)備仍然占據(jù)一定比例,成為單路徑故障點。所以在這方面還有可以進一步改進的。雙電源供電系統(tǒng)日趨成熟,但是配置結(jié)構(gòu)相對復(fù)雜,不光是設(shè)備的種類多,而且包括供應(yīng)商也很多,這個時候可能就會出現(xiàn)眾口紛紜的情況。這個“口”不光五流傳,大家有一個口碑,而且各個供應(yīng)商之間的接口也是非常重要值得我們探索和深思的。[!--empirenews.page--]
我們在這提出來一些問題,并不是說一個專門的研討會去研討它的技術(shù),只能說我們?nèi)ヌ峁┮环N解決的方向。比如說我們可以通過冗余來改變系統(tǒng)的可維護性,一個系統(tǒng)不可能不對它進行維護,任何設(shè)備、電纜、斷路器、UPS、ATS都是需要維護的。
用雙總線來增強故障容錯的能力,避免天災(zāi)人禍。比如像很多重要的行業(yè),自從四川大地震以后,包括日本地震以后,要求UPS也拿去做震動測試,震多長時間,按照多少級來震,這些實際上是對產(chǎn)品品質(zhì)的監(jiān)測,但是對于系統(tǒng)來講,我們是一個基礎(chǔ)設(shè)施,所以還是以雙總線的形式去做是一個比較好的選擇。
模塊化,大家有的時候都是考慮到UPS產(chǎn)品自身的模塊化,認(rèn)為UPS是有一個一個的抽屜插入的。這個觀念比較局限化,在大的系統(tǒng)里面,不可能采用一個10千瓦、20千瓦的模塊去拼接一個計算機系統(tǒng)?,F(xiàn)在經(jīng)常遇到的中大型數(shù)據(jù)中心變壓器2500,UPS2400,這樣一個大的系統(tǒng)要用10千瓦、20千瓦去拼的話,節(jié)點就太多了。
可管理性,剛才大家也提到了很多,包括一些新的設(shè)備和儀器,它不僅是對于設(shè)備、系統(tǒng)的管理,可管理性應(yīng)該還包括人員的管理。在942當(dāng)中,對于人員的培訓(xùn)、管理、服務(wù)提出了很明確的要求,但是大家往往看的比較多的、關(guān)注比較多的是空調(diào)應(yīng)該怎么配,UPS怎么配,接地怎么做,但是真正對于人員的管理、對于人員的培訓(xùn)重視的程度不夠。所以我們要避免一些人為的故障,預(yù)見一些問題的隱患,其實跟人員的培訓(xùn)還是有密切關(guān)系的。
系統(tǒng)的集成化,提高系統(tǒng)的可用性。我們所說的系統(tǒng)集成化并不是說所有設(shè)備的羅列,而是希望從供電設(shè)備的制造商和渠道商來講,能夠做到統(tǒng)一化。有的數(shù)據(jù)中心可能為了平衡關(guān)系,空調(diào)是一個廠家,UPS一個廠家,甚至諧波治理是另外一個廠家,有負(fù)載電路柜的供應(yīng)商等等,一套電源系統(tǒng)結(jié)果弄的十幾個供應(yīng)商,出了問題之后,大家就該相互推諉了。在工程設(shè)計和施工的規(guī)范化,采用的是比較專一的供應(yīng)商的話,工程設(shè)計和施工方面有一個按照他比較規(guī)范的行為去做這樣的事情。
設(shè)備和子系統(tǒng)的集中管理,前面專家講的比較多,在這就不占用大家時間了。
供電系統(tǒng)的諧波仍然是一個隱形故障的問題,因為在關(guān)聯(lián)系統(tǒng)當(dāng)中存在兩方面的諧波源,一個就是負(fù)載的開關(guān)電源,雖然05年以后有新的IDC標(biāo)準(zhǔn),類似于開關(guān)電源模塊的小容量電源產(chǎn)品,它的諧波不能夠超過20%。但是負(fù)載的開關(guān)電源設(shè)備都是一些單向負(fù)載,含有一定量的諧波。這些新的特性也要求UPS有一些相應(yīng)的變化。
UPS主要的諧波來自整流器,特別是可控硅整流。諧波對于電纜、供電系統(tǒng)有很大的危害。由于電源系統(tǒng)當(dāng)中諧波的存在,對于接地系統(tǒng)也提出非??量痰囊?。大家都知道,零地電壓的問題,中性線電流的問題,這些方面都有一些相應(yīng)的問題。
解決的方向,如果是UPS本身諧波高,最好輸入諧波含量低的UPS。比如,IGBT-PFC整流的無變壓器UPS。選擇按照“高負(fù)載功率因數(shù)”設(shè)計的UPS,例如06年以后設(shè)計生產(chǎn)的高頻機UPS。選擇運行效率更高的UPS,例如互動式(VI或FD)UPS。隨著數(shù)據(jù)中心的發(fā)展,計算機負(fù)載對于供電可容性要求高,對于輸入放寬了,所以互動式UPS才有可能重新進入到供電中心。從綠色、能源角度來講,互動式UPS更是發(fā)揮了它的高效率。
消除零地電壓也是電源系統(tǒng)特別重要的一個問題,但是我們覺得零地電壓在以往的電源系統(tǒng)建設(shè)當(dāng)中有一些誤導(dǎo)。現(xiàn)在的開關(guān)電源模塊是電氣完全隔離,從交流輸出到直流輸出,從220V交流輸入一直到后面計算機的輸出,中間都有高頻或者耐沖式的變壓器進行隔離。所以開關(guān)電源或者說CPU的對于交流電源系統(tǒng)的中線已經(jīng)沒有這種依賴性了,CPU對于零地電壓并不敏感。
通訊方式的改變,也是對零地電壓不是那么敏感了。過去都是采用計算機是點對點的方式,點對點應(yīng)用最多的就是串行或者并行,串行信號或者并行信號的傳輸方式現(xiàn)在已經(jīng)以以太網(wǎng)、光纜傳輸這些東西取代,所以對于直流地已經(jīng)不再依賴。新的服務(wù)器上面幾乎沒有一個明確的標(biāo)注點說這個就是直流地,我們都看不到,在這種情況下,零地電壓對計算機負(fù)載并不敏感。
再一個比較誤導(dǎo)人的是,零地電壓上升都是UPS造成的,實際上UPS并不是零地電壓上升的元兇。
隔離變壓器,它可以比較好的降低零地電壓,特別是重新組成的零線系統(tǒng),使得零地電壓比較低,但是我們也要探討加這個隔離變壓器在你的系統(tǒng)當(dāng)中對于可用性的提高有沒有必要值得商討。因為變壓器的引入帶來了很多問題,比如說變壓器的勵磁涌流的問題,它對于發(fā)電機的沖擊是一個不可忽視的問題,包括斷路器選擇性的配比,都是非常重要的問題。還有由于安裝了變壓器,假如下線負(fù)載短路,短路電流會造成變壓器二次電壓的跌落問題,如果跌落比較多,超過10%或者超過15%了,很可能這個變壓器下面所有的負(fù)載都要停電,因為變壓器的電壓過低了。
供電系統(tǒng)建造成本和能源效率問題,一個是PUE,一個是TCO。解決建造成本的問題,包括提高設(shè)備利用率。不要過度規(guī)劃,數(shù)據(jù)中心的負(fù)載量、電力的評估、電力的估算、空調(diào)制冷的估算往往會造成過度規(guī)劃。剛才很多專家也提到了,負(fù)載率那么低,你的效率不可能高,再加上過度規(guī)劃,實際負(fù)載率遠遠低于設(shè)備的負(fù)載率,這個時候?qū)τ陔娖髟O(shè)備來講,對于UPS來講,也希望UPS有智能化的休眠和喚醒功能。
系統(tǒng)運行、維護的難度問題。供電系統(tǒng)日趨復(fù)雜,沒有正常的維修保養(yǎng)時間,這是后期的運行和維護保養(yǎng)中經(jīng)常會遇到的一個問題。一個2N的系統(tǒng)或者2N+1的系統(tǒng)本身是可以同時維護的,但是系統(tǒng)的管理人員或者運維的制度不允許或者不能夠給你提供預(yù)防性的維護時間,你不停電,沒問題,你可以幫忙測測連接有沒有問題,但是一到了設(shè)備,你的設(shè)備太臟了,我得清掃,清掃肯定得停電,不停電誰敢去清掃?再說吹出來的灰塵本身含有一定的導(dǎo)電顆粒的話,也會故障。把一個可以停電維修的系統(tǒng)不給它提供預(yù)防性的維護時間。還有提到不允許轉(zhuǎn)旁路,包括在一些用戶現(xiàn)場看到過的規(guī)章,雙電源負(fù)載不允許一路供電。還有不敢進行電池放電測試的,多少時間做一次?我們一年也不做一次。為什么不敢動?動了怕電源出問題。這是運維管理者概念上的偏差。易損部件不愿意更換,在設(shè)備里面,你要想獲得一個系統(tǒng)的高可用性,對設(shè)備的維護,更換一些易損件也是必須的。[!--empirenews.page--]
系統(tǒng)要求提高運行維護水平越來越高,但是很多數(shù)據(jù)中心缺乏一個系統(tǒng)化的專業(yè)培訓(xùn)。供應(yīng)商多,工程界面多,出了故障以后,大家相互推諉,說這個不是我管的,這個你找電池廠商,那個你找發(fā)電機ATS廠商等等。
在數(shù)據(jù)中心規(guī)劃設(shè)計的時候,事實上不管是設(shè)計部門也好還是設(shè)計人員也好,對于系統(tǒng)設(shè)計缺乏一個全面保護的規(guī)劃和設(shè)計。比如說電源系統(tǒng)設(shè)計的,我就管變壓器,我就管空調(diào)多少容量,至于每一臺UPS輸入斷路器怎么診定,輸出斷路器真怎么診定,他是沒有這個設(shè)計的,設(shè)計人員拿不出一個系統(tǒng)的方案,拿出來的仍然是零零碎碎或者安全以往經(jīng)驗做出來的評估。假如說12脈沖的UPS你應(yīng)該怎么整這個斷路器。規(guī)律也很簡單,大家真正理解它了,設(shè)計人員也能做好這個工作的。
缺乏第三方認(rèn)證和評估,在國內(nèi)曾經(jīng)有人問我,你知道咱們國家哪能做數(shù)據(jù)中心等級的評估嗎?我說不知道,還真沒有一個國家的權(quán)威機構(gòu),哪怕是民間的機構(gòu)也可以。大家對于數(shù)據(jù)中心的建設(shè),說我花了這么多錢,到底我是不是按照A級的機房標(biāo)準(zhǔn)來建設(shè)的呢?到底我哪不夠A級,哪是已經(jīng)超過了A級,這種真正的第三方認(rèn)證和評估,對于整個數(shù)據(jù)中心的管理來講仍然是比較的困難。
解決方向,對于人員的管理和對于設(shè)備的管理兩方面應(yīng)該是齊頭并進的。剛才也提到了培訓(xùn),專業(yè)培訓(xùn)大家最好能夠消除一個誤會,我們的專業(yè)培訓(xùn)不應(yīng)該是某一設(shè)備的維修培訓(xùn),因為我們的運維人員針對的是管理一個整個的系統(tǒng),不管你的電源系統(tǒng)也好還是空調(diào)系統(tǒng)也好,還是安防系統(tǒng)也好,對你這個系統(tǒng)的來龍去脈,比如說電源系統(tǒng)從變壓器、發(fā)電機一直到列頭柜甚至到列頭柜的配電單元,你是不是都很清楚它的容量,知道它的利用率,知道它有什么毛病,知道它有故障的時候我去找誰,很多東西都不知道。一講培訓(xùn),就是這個設(shè)備UPS應(yīng)該怎么開關(guān)機,怎么來操作,這些不是說沒有必要,但是我們不能把運維人員的培訓(xùn)局限在原理培訓(xùn)上。還包括演練,我聽說很多銀行每個月或者兩個月都有這樣一個演練,也是非常重要的。
應(yīng)該選擇有資質(zhì)的供應(yīng)商,建立必要的專業(yè)化服務(wù)。設(shè)備的修理是設(shè)備廠家的事,但是管理這樣一個服務(wù)是我們運維人員或者數(shù)據(jù)中心管理者應(yīng)該做的,只有通過你選擇合適的供應(yīng)商,有誠信,經(jīng)過一段時間的考驗,同時建立專業(yè)化的售后服務(wù)合同,才能真正做到24小時的現(xiàn)場響應(yīng)和專業(yè)化的服務(wù)。
就簡單跟大家說這些。謝謝大家!