5G、大數據、人工智能等技術都對數據處理和網絡帶寬有了更高要求,數據中心需要不斷提升網絡帶寬去滿足,所以數據中心這段時間對提升網絡帶寬有迫切需求,尤其是互聯網的數據中心。提升網絡帶寬最直接的方式就是提升單端口的網絡帶寬,從40G提升到100G,從100G到200G,甚至更高,從而將整個數據中心的帶寬提升起來。已經有專家預測,大多數400GbE部署將在2019年開始,400GbE交換機將作為超大規(guī)模數據中心的脊柱或核心交換機,以及私有和公共云數據中心的脊柱或主干交換機啟動,要知道100G也才普及兩三年,現在就要過渡到400G,網絡帶寬提升速度越來越快。
一面是數據中心對高速模塊的強烈需求,一面是模塊故障率居高不下。相比1G、10G,40G、100G甚至200G,直觀感受故障率要高得多。當然,這些高速模塊的工藝復雜度遠比低速高,比如一個40G光模塊,本質上就是通過4個10G通道綁定起來,同時工作實現的,相當于4個10G在工作,只要有一路有問題,整個40G就無法再用了,故障率當然要比10G高,而且光模塊還要實現4條光路的協(xié)調工作,出錯概率自然更高。100G更是如此,有的就是通過10個10G通道綁定起來,還有的采用新的光技術,這些都會增加出錯可能。更高速率的更不用提了,技術成熟度上就不高,像400G仍是實驗室里的技術,2019年就要推向市場,必然出現一次故障率的小高潮,好在剛開始用量不會很多,隨著技術的不斷提升,相信也會像低俗模塊那樣逐漸穩(wěn)定。試想20年前拿到GBIC的1G光模塊去用,和現在用200G的感覺差不多,新品短期內故障率升高是必然。
好在,光模塊的故障對業(yè)務沖擊較小,數據中心的鏈路都是有冗余備份的,一條鏈路光模塊出問題,業(yè)務可走其它鏈路,如果是CRC錯包也可通過網管立即發(fā)現,及早做更換處理,所以光模塊故障很少對業(yè)務有較大影響,極少數情況下,可能因為光模塊引發(fā)設備端口故障,從而導致整個設備掛掉的情況,這種情況多是設備實現不合理導致的,很少出現,絕大多數的光模塊和設備之間是松耦合的,雖然連接在一起,并沒有耦合關系。所以雖然高速光模塊使用中壞的比較多,但對業(yè)務沖擊也沒那么大,一般不會引起人們重視,發(fā)現故障直接更換掉,高速光模塊的維保時間也長,故障了基本是免費的更換,損失也不大。
光模塊的故障多表現在端口無法UP、光模塊無法識別、端口CRC錯包等現象,這些故障與設備側、光模塊本身和鏈路質量都有些關系,尤其是錯報和無法UP,很難從軟件技術上判斷故障位置。有些還是適配類的問題,雙方都沒有問題,只不過相互之間沒有調試和適配過,導致無法在一起工作,這種情況還不少,所以不少的網絡設備都會給出適配的光模塊清單,要求客戶用自己適配過的光模塊,這樣才能保證穩(wěn)定可用。若遇到了故障,最好用的方法依然是輪換測試,換鏈路光纖、換模塊,換端口,通過這一系列測試確認到底是光模塊問題,還是鏈路或設備端口問題,好在一般這類故障現象比較確定,遇到那種故障現象不固定的就難處理了。比如端口上有CRC錯包,將光模塊直接拔出來換一個新的,故障現象消失,再將原來的光模塊換回來,故障不再復現,這就不好判斷到底是不是光模塊問題。這種情況在實際使用中也會經常碰到,這讓人難做判斷。
如何降低光模塊的故障率?
第一,抓好源頭,更高帶寬的光模塊不要急于推向市場,要做好充分的實驗,而且高速模塊需要相應的設備配套實現,這些技術也需要完善才能成熟,新的高速模塊要平滑地引入市場,不要簡單地追求高速,現在網絡設備都支持多端口捆綁,400G不行,就用4個100G捆綁也可以滿足需求;
第二,抓好高速光模塊的引入,網絡設備商和數據中心客戶,在引入高速光模塊上要慎重,增加對高速光模塊的嚴格測試,堅決過濾質量上有缺陷的產品?,F在市面上高速光模塊市場競爭也比較激烈,都希望在新的高速模塊上搶占先機,但質量和價格參差不齊,這就需要網絡設備商和數據中心客戶能加大考核力度,越是速率高的模塊,越增加驗證的復雜度;
第三,光模塊其實是一個集成度特別高的器件,露在外面的光纖通道和內部器件都比較脆弱,使用時要輕拿輕放,帶上干凈手套,避免落入灰塵,這些也會降低使用故障率,不用的光模塊要帶好光纖帽,放在袋子里。第四,盡量少的出現極限情況,比如100G的光模塊長期在接近限速的情況下使用,200米距離的光模塊,偏偏要在200米距離使用,這些極限邊界值使用對光模塊的損耗較大,它就像人一樣,人在24~26度的空調房里工作,工作效率就高,到了35度外面的高溫環(huán)境,注意力無法長時間集中,工作效率極低,到了40度以上,人都快中暑了還怎么工作。為光模塊提供一個令其舒適的環(huán)境,能夠有效延長光模塊的使用壽命。
隨著海量數據的增長,數據中心帶寬需求越來越高,引入更高速的光模塊成了必由之路,必須控制好其質量的問題。如果新的高速模塊在市場上頻繁碰壁,也難逃被淘汰的結果。當然,任何一種新技術都有一個走向成熟的過程,高速光模塊也不例外,需要不斷地技術創(chuàng)新,解決各種問題,提升模塊質量,降低故障概率。高速光模塊是模塊廠商的利潤引擎,是歷代模塊廠商的必爭之地,必須要嚴控質量關。