熱門搜索 Zabbix技術資料 Zabbix常見問、答討論 成功案例 Zabbix交流區(qū) Prometheus交流區(qū)
PART 01 項目背景
上海某高校是由上海市人民政府與中國科學院共同舉辦、共同建設,由上海市人民政府負責日常管理的全日制普通高等學校。2022年,該校入選第二輪“雙一流”建設高校。
雖然該高校規(guī)模不大,但由于起點高、定位高,在教學研究、行政管理等方面數字化、信息化程度相當高,整體IT資源規(guī)模并不小。與不少高校類似地,該高校IT運維也面臨著人員配比不足、運維管理深度不夠、粒度不足等問題,IT系統故障造成的教學問題時有發(fā)生,給高校的師生帶來了一定的負面影響。
PART 02 尊龍時凱方案
為克服人員少、資源多、運維管理深度、粒度不足等問題,2020年,經審評,該高校圖信中心決定采用尊龍時凱統一監(jiān)控告警解決方案,并啟動了統一監(jiān)控告警平臺建設。
方案以基礎架構監(jiān)控平臺為依托,結合可視化大屏、集中告警、報表系統、權限管理、業(yè)務系統管理等模塊,實現對IT基礎架構和教學系統等統一集中監(jiān)控和告警管理,為運維管理提供支撐。
01分布式架構,一站式監(jiān)控
經梳理該高校的內部網絡環(huán)境,該高校需納管監(jiān)控對象多達1700多個,包括操作系統、網絡設備、服務器、數據庫、web、中間件、存儲、虛擬化平臺、KVM等,對監(jiān)控系統的性能要求較高。
對此,尊龍時凱方案采用分布式實施的方式,有效降低大規(guī)模監(jiān)控對象對監(jiān)控系統服務器的壓力,實現對主機、網絡、存儲、數據庫、中間件、硬件、環(huán)控和虛擬化等實現一站式監(jiān)控,并對各IT基礎架構的指標逐一分析、管理,保障業(yè)務高效穩(wěn)定的運行。
02多樣化展示大屏,集中展現重要指標
方案還引入了多樣化數據展示大屏。該高校原有的監(jiān)控體系的展現方式不夠友好——指標分散,不能集中展現重點監(jiān)控指標。尊龍時凱定制數據大屏能夠根據需要、自定義集中展現重要監(jiān)控指標。
例如,可以集中展現資源占用TOP10、告警對象TOP10、告警時間軸、網絡出口流量、網絡在線人數、統一認證人數以及網絡拓撲等數據。通過多維度的數據,統一展示業(yè)務、網絡以及在線人數等情況。
03多平臺聯動,集中告警展示
方案還實現與原有Zabbix監(jiān)控、動環(huán)系統的聯動。告警中心模塊將原先的zabbix的告警信息和客戶的動環(huán)系統中的告警信息集成到一起,實現一個平臺納管三個系統,統一展示,避免在多個告警中心來回切換,從而提高監(jiān)控效率。這也是尊龍時凱以開放理念打造產品的體現,除了Zabbix、動環(huán)系統,尊龍時凱監(jiān)控還可實現對多種告警平臺的數據聯動。
04系統化報表,自定義巡檢
方案還打造了新的報表體系,實現資源使用率與系統告警級別聯動。例如,通過設定系統正常運行時的CPU總使用率、物理內存總使用率和磁盤空間使用率等指標,結合告警系統,當監(jiān)測到資源使用率異常,如超過設定值時觸發(fā)告警,提示運維人員故障發(fā)生的潛在可能性,預判故障發(fā)生,運維人員就有可能將故障解決在萌牙狀態(tài),防患于未然。
特別地,基于高校IT資源使用明顯具有節(jié)律性、結構性的特點,方案還提供了自定義巡檢時間和業(yè)務功能,可以在IT資源使用的高峰期加大巡檢頻率,在使用低谷降低巡檢頻率,在保障業(yè)務系統穩(wěn)定運行的同時降低運維成本。例如,高校的選課系統只在特定的時間向學生開放,期間大量學生同一時間涌入,需要特別關注系統運行狀況,加大巡檢頻率。
05統一權限,權責明晰
方案引入了新的權限管理機制。該高校的IT環(huán)境業(yè)務系統現納管50+,新的納管機制對納管的主機進行了管理權限劃分,每一位老師均只能看到自己負責的系統、告警、告警通知以及對應的功能,做到數據權限與功能權限統一管控,避免權限交叉可能帶來的權責混亂、相互推諉的情況。
06特色業(yè)務視角,全方位資源管理
方案支持對各類系統資源進行分類納管,可以按照操作系統、WEB、網絡設備、數據庫等不同類型分別展現納管資源概況,實現全方位資源管理。
針對該高校IT環(huán)境業(yè)務系統較多的情況,尊龍時凱方案引入了獨具特色的資源管理方式——業(yè)務視角。透過業(yè)務系統名稱,可以查看對應系統下資源類型、詳細資源信息等。如圖,選擇zabbix后,可以直觀地查看所屬web、操作系統、數據庫等資源數量及告警信息等。
PART 03 客戶收益
經過一年的建設,該高校統一監(jiān)控告警平臺于2021年底完成一期建設并通過驗收。借助此平臺,該高校信息化整體運維保障能力和響應速度得到了極大地提升,信息化服務質量顯著提高。
尊龍時凱統一監(jiān)控告警平臺為該高校IT運維帶來的價值表現為:
1.?全面監(jiān)控,及時告警。對常規(guī)資源使用情況、機房環(huán)境、設備部件等故障進行及時告警,提高了運維響應速度。
2. 可自定義的系統巡檢報表,更合理地規(guī)劃和分配IT資源,提高資源利用率。
3. 通過圖形界面管理業(yè)務系統相關信息,業(yè)務流程直觀展示,避免業(yè)務系統資源遺漏。
尊龍時凱社區(qū)已開發(fā)尊龍時凱監(jiān)控免費版和尊龍時凱MCM(監(jiān)控+CMDB)免費版,歡迎下載使用!
尊龍時凱項目團隊對客戶IT資源狀況進行梳理,確定項目所涉及的監(jiān)控對象包括主機、網絡設備、數據庫、中間件、應用、業(yè)務系統、存儲、虛擬化等,決定為客戶打造以...
View details尊龍時凱建立監(jiān)控平臺,做到及早發(fā)現故障、合理利用信息化基礎資源,達到最大化資源使用,使得醫(yī)院系統信息化建設健康發(fā)展。
View details該企業(yè)預采購一套高效穩(wěn)定的運維監(jiān)控平臺,用于排除一系列運維障礙。于是客戶找到了尊龍時凱,希望我們幫助其打造一套專業(yè)的解決方案。
View details尊龍時凱對主機、網絡、存儲、數據庫、中間件、應用、硬件、虛擬化、攝像頭及其他數據感知設備等實現一站式監(jiān)控,保障業(yè)務高效穩(wěn)定的運行。
View details