從網(wǎng)絡發(fā)展看無線網(wǎng)絡故障排查需求
一、當最后100米無線化
所有對網(wǎng)絡故障維護有較長期經(jīng)驗的人都清楚,早期網(wǎng)絡大概75%左右的故障來自于物理連接故障,也就是來自于網(wǎng)線或物理接口。后期伴隨綜合布線理念的貫徹與執(zhí)行,制造工藝的提升,線纜與接口質量的提升,這一故障的比例大幅度降低了。那么當我們的最后100米無線化之后,網(wǎng)線和物理接口會出現(xiàn)什么樣的情況呢?
1.1 靈活性的大躍進與技術本身的退步
首先我們應該有一個明確的認識,無線WLAN網(wǎng)絡事實上是網(wǎng)絡靈活性的提升和網(wǎng)絡技術的倒退。從技術角度講,WLAN本身將網(wǎng)絡技術倒退了至少5-10年,即從交換式以太網(wǎng)年代退回到共享式以太網(wǎng)年代。這種倒退從物理介質角度而言尤甚,因為在當前的交換式以太網(wǎng)技術中,每個用戶是獨享傳輸介質的,但是在無線技術中,所有的用戶共享物理信道,只要用戶間相互可見,無論有多少個AP,所有工作在同一頻點的用戶共享相同的物理介質。這就是典型的同軸共享式以太網(wǎng)或基于HUB的共享式以太網(wǎng)的特征。
那么在共享式以太網(wǎng)里需要考慮的物理數(shù)據(jù)碰撞、網(wǎng)絡用戶量與數(shù)據(jù)量規(guī)模無法無限擴展等問題重新歸來,因此網(wǎng)絡排錯時需要考慮的因素增加了。
1.2 便捷性與管理復雜度的雙重提升
相較以太網(wǎng),WLAN在提升便捷性的同時,其傳輸介質發(fā)生了明顯的變化,從現(xiàn)在幾乎絕對可信的銅纜和光纖變?yōu)榻^對不可信的頻譜資源,因此,管理無線網(wǎng)絡的網(wǎng)管人員除必須擁有管理以太網(wǎng)絡必備的充足TCP/IP知識外,還必須理解無線網(wǎng)絡中的射頻知識,例如對信噪比、信號強度、發(fā)射功率、天線增益、干擾等概念的真正理解,以及對802.11協(xié)議的獨特特性,例如重傳的概念的真正理解。管理無線網(wǎng)絡對網(wǎng)管員的知識體系提出了新的挑戰(zhàn),并且對接入介質的管理復雜度呈幾何級提升。
1.3 從管理“有”到管理“無”
傳統(tǒng)以太網(wǎng)是有線網(wǎng)絡,所有的連接是可見的,某個終端連接到具體哪個設備是明確的。而無線網(wǎng)絡的連接是不可見的,某個終端在整個的接入過程中會不斷的發(fā)生切換,從一個接入設備切換到另外一個接入設備。在某些極端情況下,設備會在兩個不同的接入AP之間一分鐘之內切換幾十甚至上百次,并且這種切換完全由客戶端決定,傳統(tǒng)網(wǎng)管軟件的刷新速率已經(jīng)完全無法把握這種情況,這無疑成為如何進行無線網(wǎng)絡管理所需解決的又一個重點問題。
二、摩托羅拉系統(tǒng)將無線故障排查可視化
2.1 無線網(wǎng)絡拓撲的可視化
不一樣的無線網(wǎng)絡拓撲。當討論有線網(wǎng)絡拓撲圖時,我們只需將客戶端簡單地連接到接入交換機的物理接口即可。但是在無線里同一個AP還需要討論其ESS/BSS的問題,因此拓撲圖應該是客戶端接入了哪一個BSS,然后這個BSS接入到哪一個ESS。所以,無線網(wǎng)絡的拓撲圖與有線網(wǎng)絡的拓撲圖是完全不同的。
2.2 不同的物理狀態(tài)
在無線領域中,沒有明確的線纜連接,只有無線區(qū)域的覆蓋好壞,而且無線網(wǎng)絡的動態(tài)特征導致這種覆蓋好壞是變化的。因此,我們需要實時熱圖來監(jiān)控整個無線網(wǎng)絡,使其真正的可視起來。
2.3 物理層排錯
在物理層排錯時,大家普遍認為無線的干擾是網(wǎng)絡質量的罪魁禍首。但是事實上,無線網(wǎng)絡中的資源利用率和干擾強度的組合才是真正的問題所在,而且干擾不僅僅是WLAN對WLAN的干擾,還包括其它同頻干擾,例如微波、2.4GHz無線電遙控射頻信號或者藍牙信號。因此,在物理層排錯中,我們必須對所有的干擾源進行分析,同時對其資源利用率進行監(jiān)控。僅僅通過網(wǎng)上某些免費的工具是不能夠真正定位問題所在的。
舉一個簡單的例子,大家隨便找兩個AP,將其設定在同一個信道上,然后把它們的發(fā)射功率調到最大,物理間隔僅10厘米。用傳統(tǒng)軟件看,這種干擾是極強的。但是如果有一個AP上有用戶,另外一個AP上一個用戶都沒有,或者即使兩個AP都有用戶,在AP的競爭策略設定合理、用戶流量不大的情況下,我們的上網(wǎng)感知仍然會相當好。
相反,如果我們將兩個AP之間的距離拉遠到30米,每個AP上都接入用戶,并且采用大流量,此時,用傳統(tǒng)軟件看到的干擾會較小,但是實際的使用感知卻非常差。
還有一種情況,如果我們只使用一個AP,并讓幾個用戶同時接入,在用戶處在互相不可見的位置同時觀看高質量視頻時,所有用戶的感知都會很差。但在這種情況下,傳統(tǒng)軟件會認為這是沒有干擾的。
摩托羅拉系統(tǒng)選擇對整個無線網(wǎng)絡的整個物理層實現(xiàn)完整的呈現(xiàn),包括各個信道的干擾強度、信道使用率以及是否有非WLAN的干擾。在下圖的示例中,信道11的干擾高達-25dBm,但是利用率只有5%,而信道1的干擾在-40到-50dBm之間,接口利用率卻高達100%,而且是持續(xù)的微波干擾。在這種情況下,信道1干擾小,但基本是不可使用的。信道11干擾極強,卻一定是客戶體驗最好的。因此,物理層可視化在無線網(wǎng)絡中是非常重要的。
2.3 您真的知道網(wǎng)絡的情況嗎?
在傳統(tǒng)以太網(wǎng)中,如果用戶出現(xiàn)玩游戲頻繁“卡”的情況,那么,查看一下互聯(lián)網(wǎng)出口的擁塞程度和用戶Ping DHCP服務器的響應時間,就基本可以定位問題所在了。但是對于無線網(wǎng)絡而言,頻繁“卡”很有可能是無線和有線雙重因素導致。
如果是響應較慢,需要定位是無線慢還是有線慢;如果是無線慢,還要確認是哪種無線因素導致了緩慢。那么,到底是由于干擾、沖突、,無線網(wǎng)絡整體性能不足還是覆蓋不合理的頻繁漫游切換導致了這個問題呢?
有些時候,由于無線網(wǎng)絡是共享式的,我們在無線中只要有一個或幾個用戶是低速率用戶,整體網(wǎng)絡性能就會大幅度的下降。在20個終端中部分是802.11n AP的網(wǎng)絡(如18個802.11n加2個802.11b),其整體網(wǎng)絡性能可能遠遠低于20個均是802.11g的網(wǎng)卡。因此,如果一個用戶玩游戲卡,很有可能是另外一個用戶的網(wǎng)卡速率低造成的。
另外,如何排查用戶在兩個AP間頻繁切換的問題呢?如何排查用戶的性能是由于干擾造成的呢?對于無線網(wǎng)絡的排錯需要看一個信道、一個用戶、一個BSS的整體情況,而不是僅僅排查某個用戶。
摩托羅拉系統(tǒng)通過一個界面可以遠程的了解數(shù)據(jù)的信號噪聲比(干擾)、用戶的重傳(空口負載情況)、數(shù)據(jù)傳輸速率(是否有低速率用戶影響了整個網(wǎng)絡性能)、用戶的傳輸信道分配(是否用戶短時間內在兩個不同信道內發(fā)射,也就是在頻繁漫游),完全可視化地監(jiān)控全部可能存在的故障。
如果網(wǎng)管人員不足、無法實時監(jiān)控時,摩托羅拉系統(tǒng)可以定義網(wǎng)絡質量劣化的兩大重要指標——傳輸速率和重傳率的門限,對網(wǎng)絡進行實時監(jiān)控,一旦指標超越門限值即可通過告警了解到這一情況,并且通過對歷史數(shù)據(jù)的詳細分析確認網(wǎng)絡故障的具體原因。
例如從附圖中網(wǎng)管員了解過去24小時中的不同類型報文比例,如果將這一趨勢分析放大到季度或者年度,我們又可以分析網(wǎng)絡趨勢,及時調整網(wǎng)絡以避免問題的大規(guī)模爆發(fā)。
三、通過故障排查可視化確保網(wǎng)絡的真正可用性
網(wǎng)絡最后100米由WLAN接管是大勢所趨,應用的多終端協(xié)同化是大勢所趨,關鍵應用效率提升通過移動應用方式實現(xiàn)也是大勢所趨。無線網(wǎng)絡技術倒退是實際情況,無線網(wǎng)絡的物理介質脆弱是實際情況,無線網(wǎng)絡不可視也是實際情況。
要求無線網(wǎng)絡完全無故障是不現(xiàn)實的,在這樣的實際要求下,無線網(wǎng)絡故障排查的高效率是我們必須提供的,尤其是將關鍵應用部署于無線之上的機構。