熱門(mén)搜索 Zabbix技術(shù)資料 Zabbix常見(jiàn)問(wèn)、答討論 成功案例 Zabbix交流區(qū) Prometheus交流區(qū)
主服務(wù)器是windows,備服務(wù)器是Linux,需求是當(dāng)zabbix監(jiān)控的主服務(wù)器上的Tomcat停止了,則切換到Linux的Tomcat,保證業(yè)務(wù)的正常訪(fǎng)問(wèn)。
主服務(wù)器(windows)
備服務(wù)器(linux)
程序啟動(dòng)目錄\命令
10.172.200.155
10.173.220.85
主:D:\apache-tomcat-7.0.103\bin\startup.bat
備:service tomcat7 start
10.172.200.156
10.10.220.37
主:C:\software\apache-tomcat-7.0.92\bin\startup.bat
備:service tomcat7 start
在監(jiān)控平臺(tái)上做相應(yīng)的告警動(dòng)作通知和遠(yuǎn)程啟動(dòng)備機(jī)服務(wù)器程序的命令,當(dāng)檢測(cè)到問(wèn)題時(shí)由監(jiān)控系統(tǒng)完成切換程序動(dòng)作。
實(shí)現(xiàn)過(guò)程說(shuō)明:
1、監(jiān)控到主服務(wù)器的Tomcat或者操作系統(tǒng)死了,發(fā)出警告預(yù)警
2、啟動(dòng)備機(jī)的Tomcat
3、待監(jiān)控到主服務(wù)器Tomcat恢復(fù)了,發(fā)出通知已經(jīng)恢復(fù)
4、人員檢查確認(rèn)恢復(fù),手動(dòng)關(guān)閉備機(jī)Tomcat
主備服務(wù)器宕機(jī)告警和Tomcat停止運(yùn)行通知?jiǎng)幼?:
以下為 156-中間件備服務(wù)器的遠(yuǎn)程命令操作示例,其余通知?jiǎng)幼鞑僮黝?lèi)似:
在 配置 – 動(dòng)作— 點(diǎn)擊156-tomcat-告警
當(dāng)檢查到主服務(wù)器的程序正常運(yùn)行時(shí),發(fā)送恢復(fù)通知內(nèi)容,提醒管理員手動(dòng)切換程序。
由采集服務(wù)器通過(guò)SSH遠(yuǎn)程方式登錄到agent端,發(fā)送命令框里面設(shè)定的命令行,執(zhí)行相應(yīng)的操作,
判斷主機(jī)宕機(jī):通過(guò)結(jié)合使用agent客戶(hù)端 + ICMP方式,先判斷agent客戶(hù)端在一定時(shí)間范圍內(nèi)沒(méi)有采集到數(shù)據(jù),且主機(jī)IP不能被采集服務(wù)器Ping通,則判斷主機(jī)宕機(jī)。
判斷Tomcat程序在設(shè)定的時(shí)間范圍內(nèi)沒(méi)有采集到數(shù)據(jù)且遠(yuǎn)程訪(fǎng)問(wèn)的8080端口不通,則判定程序停止運(yùn)行,觸發(fā)第2步的告警動(dòng)作和遠(yuǎn)程啟動(dòng)備機(jī)程序命令。
為免因?yàn)榫W(wǎng)絡(luò)問(wèn)題發(fā)生誤告警誤觸發(fā)遠(yuǎn)程命令現(xiàn)象,建議把觸發(fā)器的時(shí)間改為2分鐘到5分鐘內(nèi),例如,監(jiān)控項(xiàng)的更新間隔為60s,觸發(fā)器就設(shè)置為檢查2次,2次都沒(méi)有檢查到數(shù)據(jù),則發(fā)送告警通知并執(zhí)行遠(yuǎn)程命令。
更多zabbix技術(shù)資料,請(qǐng)持續(xù)關(guān)注尊龍時(shí)凱社區(qū):http://forum.ydcanyin.com/
Zabbix優(yōu)缺點(diǎn)分明,不能完全滿(mǎn)足需求,需要進(jìn)行二次開(kāi)發(fā)
View detailszabbix日常命令有哪些?其中包括zabbix_server、zabbix_proxy、zabbix_get、zabbix_agentd、zabbix_agent2
View detailsZabbix與尊龍時(shí)凱監(jiān)控對(duì)比分析專(zhuān)題系列文章的第六篇——圖形圖表篇,包括二者在模板圖形及模板表格等功能的對(duì)比分析。
View details采用分布式實(shí)施,分別集中監(jiān)控線(xiàn)上(阿里云) IT基礎(chǔ)架構(gòu)和線(xiàn)下IT基礎(chǔ)架構(gòu),將不同類(lèi)別的基礎(chǔ)架構(gòu)統(tǒng)一在一個(gè)平臺(tái)上實(shí)現(xiàn)監(jiān)控功能。分別對(duì)主機(jī)、網(wǎng)絡(luò)、存儲(chǔ)、數(shù)據(jù)...
View details尊龍時(shí)凱為該協(xié)會(huì)部署了一站式監(jiān)控和告警系統(tǒng)并配置了業(yè)務(wù)拓?fù)?、網(wǎng)絡(luò)拓?fù)?、報(bào)表圖形和自定義視圖等功能。
View details尊龍時(shí)凱采用分布式實(shí)施,分別對(duì)主機(jī)、網(wǎng)絡(luò)、存儲(chǔ)、數(shù)據(jù)庫(kù)、中間件、應(yīng)用、硬件和虛擬化等實(shí)施一站式監(jiān)控。
View details尊龍時(shí)凱監(jiān)控對(duì)接華三CAS云管平臺(tái)監(jiān)控方案
View details