zabbix 監(jiān)控Linux
一旦在服務(wù)器上安裝了客戶端,便會使用此模型配置服務(wù)器。 它自動搜索服務(wù)器上的所有網(wǎng)卡,然后實(shí)時記錄流量和流量,并在標(biāo)準(zhǔn)顯示中將它們記錄如下。
有這個粗略的統(tǒng)計可以幫助運(yùn)維人員了解服務(wù)器的健康情況,但是有時候我們需要更加精細(xì)的監(jiān)控,監(jiān)控粒度要精細(xì)到某個端口和,比如統(tǒng)計端口,端口以時間為軸的流量變動情況。
或者統(tǒng)計來自和流量的變化情況,甚至更進(jìn)一步,統(tǒng)計訪問本機(jī)端口產(chǎn)生的流量。
這種需求使用基于網(wǎng)卡的監(jiān)控已經(jīng)不足以實(shí)現(xiàn),必須使用新方法。
好在網(wǎng)絡(luò)流量都會經(jīng)過內(nèi)核模塊,能夠以極高的效率進(jìn)行協(xié)議數(shù)據(jù)包和流量的統(tǒng)計,在記錄和統(tǒng)計時幾乎不影響系統(tǒng)性能,而且查詢計數(shù)器和清零計數(shù)器也以毫秒為單位。
通過靈活的過濾命令,我們可以像配置防火墻一樣配置我們需要監(jiān)控的流量,然后配合自定義輪訓(xùn)取值功能,將客戶機(jī)統(tǒng)計的結(jié)果收集到當(dāng)中,并繪制形,就可以直觀準(zhǔn)確的分析流量了。
首先我們要補(bǔ)充一些知識,這里我就不贅述了,可以看下面這篇文章
大體來說,就是通過在表中添加相關(guān)端口和的監(jiān)控條目,然后定時使用命令查看數(shù)據(jù)包的數(shù)量和流量大小,并定期使用命令清空計數(shù)器。
最后就得到每分鐘或每小時某端口的流量了。
我目前設(shè)計了兩個場景,一個是統(tǒng)計某服務(wù)器端口的流量變化情況,另一個是統(tǒng)計訪問某服務(wù)器端口的流量情況,服務(wù)器每秒收集一次數(shù)據(jù),并清空計數(shù)器,然后把收集到的數(shù)據(jù)除以,就是平均每秒的流量。
首先我們設(shè)置規(guī)則
然后寫一個腳本,用來調(diào)用,獲取當(dāng)前一段時間統(tǒng)計的流量
|
這個腳本傳入了兩個參數(shù),是取結(jié)果的第幾行,一般從第三行開始就是具體規(guī)則統(tǒng)計的信息了,通過上面命令,觀察后得出是第三行和第四行
是來取值的間隔,單位是秒,通過某段時間的流量除以這段時間的長度就得出每秒的流量,返回給。
由于只能由用戶進(jìn)行調(diào)用,客戶端的用戶為,沒有權(quán)限使用,如果不加,調(diào)用時就會報錯
所以要添加,可是用戶并不是想用就可以用的,根據(jù)我另一篇關(guān)于權(quán)限的博客經(jīng)驗(yàn)遠(yuǎn)程命令權(quán)限不足問題解決方法,通過修改文件來使用戶可以使用命令。
方法就是在文件中添加下面一行
另外以上不要忘了把也一并關(guān)閉
此時我們就可以在客戶機(jī)上測試這個腳本是不是可以正常取到流量值了,單位為
上面就是以用戶運(yùn)行腳本文件,取結(jié)果的第四行中流量值的大小,結(jié)果應(yīng)為正整數(shù),如下
然后需要為設(shè)置一個,用于取值,此時我們需要在的配置文件夾中增加一個文件,配置自定義監(jiān)控鍵,我的配置文件夾為,我在里面新建了一個文件名為,內(nèi)容如下
然后我們客戶端的工作就已經(jīng)做好了,此時需要重啟以生效
然后我們登錄服務(wù)器,先使用命令查看一下能否成功取到監(jiān)控值
上面就是客戶機(jī)的地址,是我們上面客戶機(jī)配置文件中配置的,是輸出結(jié)果的第三行,對應(yīng)著表第一條條目監(jiān)控的流量。
是把獲得流量除以,因?yàn)槲以O(shè)置秒收集一次并清空計數(shù)器,所以每秒的平均流量就除以,你也可以設(shè)置秒或秒,不過太頻繁也沒有必要。
如果能取到正整數(shù),那么我們客戶機(jī)配置的沒有問題,如果取不到,可以逐行屏蔽上面的腳本進(jìn)行調(diào)試。
一般問題容易出在的權(quán)限上面。
然后我們就可以到的控制臺增加監(jiān)控項(xiàng)和表了,如下,主要就是設(shè)置更新間隔和第幾行,保證更新間隔秒和第二個參數(shù)一致
配置表,如下
主要就是將剛才設(shè)置的監(jiān)控項(xiàng)放進(jìn)去,然后調(diào)整一下坐標(biāo)軸和線的顏色
配置完成后等待幾分鐘,就可以看到了,如下
如果沒有線出現(xiàn),那么就到的檢測中最新數(shù)據(jù)里查看報錯內(nèi)容,如下
小彩蛋
很多人在監(jiān)控的時候還需要同時監(jiān)控連接情況,尤其是和狀態(tài)的連接數(shù)量,和上面一樣,可以通過腳本并授權(quán)用戶獲取
可執(zhí)行腳本文件,第一個參數(shù)為狀態(tài),如
|,|||,|||,|||,|||,|||,|||,||
的監(jiān)控項(xiàng)配置如下
形配置如下
然后就可以查看連接狀態(tài)的效果了
可以明顯的看到,白天時候的連接數(shù)比晚上的多。
而且通過這種方式,可以直觀的看出有沒有連接泄露之后不的連接。。