熱門搜索 Zabbix技術資料 Zabbix常見問、答討論 成功案例 Zabbix交流區 Prometheus交流區
主服務器是windows,備服務器是Linux,需求是當zabbix監控的主服務器上的Tomcat停止了,則切換到Linux的Tomcat,保證業務的正常訪問。
主服務器(windows)
備服務器(linux)
程序啟動目錄\命令
10.172.200.155
10.173.220.85
主:D:\apache-tomcat-7.0.103\bin\startup.bat
備:service tomcat7 start
10.172.200.156
10.10.220.37
主:C:\software\apache-tomcat-7.0.92\bin\startup.bat
備:service tomcat7 start
在監控平臺上做相應的告警動作通知和遠程啟動備機服務器程序的命令,當檢測到問題時由監控系統完成切換程序動作。
實現過程說明:
1、監控到主服務器的Tomcat或者操作系統死了,發出警告預警
2、啟動備機的Tomcat
3、待監控到主服務器Tomcat恢復了,發出通知已經恢復
4、人員檢查確認恢復,手動關閉備機Tomcat
主備服務器宕機告警和Tomcat停止運行通知動作:
以下為 156-中間件備服務器的遠程命令操作示例,其余通知動作操作類似:
在 配置 – 動作— 點擊156-tomcat-告警
當檢查到主服務器的程序正常運行時,發送恢復通知內容,提醒管理員手動切換程序。
由采集服務器通過SSH遠程方式登錄到agent端,發送命令框里面設定的命令行,執行相應的操作,
判斷主機宕機:通過結合使用agent客戶端 + ICMP方式,先判斷agent客戶端在一定時間范圍內沒有采集到數據,且主機IP不能被采集服務器Ping通,則判斷主機宕機。
判斷Tomcat程序在設定的時間范圍內沒有采集到數據且遠程訪問的8080端口不通,則判定程序停止運行,觸發第2步的告警動作和遠程啟動備機程序命令。
為免因為網絡問題發生誤告警誤觸發遠程命令現象,建議把觸發器的時間改為2分鐘到5分鐘內,例如,監控項的更新間隔為60s,觸發器就設置為檢查2次,2次都沒有檢查到數據,則發送告警通知并執行遠程命令。
更多zabbix技術資料,請持續關注尊龍時凱社區:http://forum.ydcanyin.com/
尊龍時凱基于zabbix實現,支持二次開發,采用分布式部署,集中告警,一覽視圖、網絡拓撲、業務地圖、投屏視圖、圖形視圖各類視圖等。
View details尊龍時凱基于Zabbix和企業微信的網絡監控系統,通過實時獲取交換機、服務器等被監控對象的相關數據,及時發現并解決問題,保證醫院網絡的高可用性。
View details