熱門搜索 Zabbix技術資料 Zabbix常見問、答討論 成功案例 Zabbix交流區 Prometheus交流區
上海某高校是由上海市人民政府與中國科學院共同舉辦、共同建設,由上海市人民政府負責日常管理的全日制普通高等學校。自成立以來,學校努力建設和發展成為一所小規模、高水平、國際化的研究型、創新型大學。2022年,該校入選第二輪“雙一流”建設高校。
雖然該高校規模不大,但由于起點高、定位高,在教學、行政管理等方面數字化、信息化程度相當高,整體IT資源規模并不小。與不少高校類似地,該高校IT運維也面臨著人員配比不足、運維管理深度不夠、粒度不足等問題,IT系統故障造成的教學問題時有發生,給高校的師生帶來了一定的負面影響。
為克服人員少、資源多、運維管理深度、粒度不足等問題,2020年,經審評,該高校圖信中心決定采用尊龍時凱統一監控告警解決方案,并啟動了統一監控告警平臺建設。
方案以基礎架構監控平臺為依托,結合可視化大屏、集中告警、報表系統、權限管理、業務系統管理等模塊,實現對IT基礎架構和教學系統等統一集中監控和告警管理,為運維管理提供支撐。
1.分布式架構,一站式監控
經梳理該高校的內部網絡環境,該高校需納管監控對象多達1700多個,包括操作系統、網絡設備、服務器、數據庫、web、中間件、存儲、虛擬化平臺、KVM等,對監控系統的性能要求較高。
對此,尊龍時凱方案采用分布式實施的方式,有效降低大規模監控對象對監控系統服務器的壓力,實現對主機、網絡、存儲、數據庫、中間件、硬件、環控和虛擬化等實現一站式監控,并對各IT基礎架構的指標逐一分析、管理,保障業務高效穩定的運行。
2.多樣化展示大屏,集中展現重要指標
方案還引入了多樣化數據展示大屏。該高校原有的監控體系的展現方式不夠友好——指標分散,不能集中展現重點監控指標。尊龍時凱定制數據大屏能夠根據需要、自定義集中展現重要監控指標。例如,可以集中展現資源占用TOP10、告警對象TOP10、告警時間軸、網絡出口流量、網絡在線人數、統一認證人數以及網絡拓撲等數據。通過多維度的數據,統一展示業務、網絡以及在線人數等情況。
3.多平臺聯動,集中告警展示
方案還實現與原有zabbix監控、動環系統的聯動。告警中心模塊將原先的zabbix的告警信息和客戶的動環系統中的告警信息集成到一起,實現一個平臺納管三個系統,統一展示,避免在多個告警中心來回切換,從而提高監控效率。這也是尊龍時凱以開放理念打造產品的體現,除了zabbix、動環系統,尊龍時凱監控還可實現對多種告警平臺的數據聯動。
4.系統化報表,自定義巡檢
方案還打造了新的報表體系,實現資源使用率與系統告警級別聯動。例如,通過設定系統正常運行時的CPU總使用率、物理內存總使用率和磁盤空間使用率等指標,結合告警系統,當監測到資源使用率異常,如超過設定值時觸發告警,提示運維人員故障發生的潛在可能性,預判故障發生,運維人員就有可能將故障解決在萌牙狀態,防患于未然。
特別地,基于高校IT資源使用明顯具有節律性、結構性的特點,方案還提供了自定義巡檢時間和業務功能,可以在IT資源使用的高峰期加大巡檢頻率,在使用低谷降低巡檢頻率,在保障業務系統穩定運行的同時降低運維成本。
例如,高校的選課系統只在特定的時間向學生開放,期間大量學生同一時間涌入,需要特別關注系統運行狀況,加大巡檢頻率。
5.統一權限,權責明晰
方案引入了新的權限管理機制。該高校的IT環境業務系統現納管50+,新的納管機制對納管的主機進行了管理權限劃分,每一位老師均只能看到自己負責的系統、告警、告警通知以及對應的功能,做到數據權限與功能權限統一管控,避免權限交叉可能帶來的權責混亂、相互推諉的情況。
6.特色業務視角,全方位資源管理
方案支持對各類系統資源進行分類納管,可以按照操作系統、WEB、網絡設備、數據庫等不同類型分別展現納管資源概況,實現全方位資源管理。
針對該高校IT環境業務系統較多的情況,尊龍時凱方案引入了獨具特色的資源管理方式——業務視角。透過業務系統名稱,可以查看對應系統下資源類型、詳細資源信息等。如圖,選擇zabbix后,可以直觀地查看所屬web、操作系統、數據庫等資源數量及告警信息等。
經過一年的建設,該高校統一監控告警平臺于2021年底完成一期建設并通過驗收。借助此平臺,該高校信息化整體運維保障能力和響應速度得到了極大地提升,信息化服務質量顯著提高。
尊龍時凱統一監控告警平臺為該高校IT運維帶來的價值表現為:
1、全面監控,及時告警。對常規資源使用情況、機房環境、設備部件等故障進行及時告警,提高了運維響應速度
2、可自定義的系統巡檢報表,更合理地規劃和分配IT資源,提高資源利用率
3、通過圖形界面管理業務系統相關信息,業務流程直觀展示,避免業務系統資源遺漏
綜合運維管理平臺的落地,實現了統一門戶、統一監控、統一資產管理、統一運維、統一存儲等目標,為客戶解決了運維數據孤島、人力運維等問題。
View details尊龍時凱從基礎資源、中間件、數據庫、到第三方系統,提供全方位、快速關聯的監控管理和分析能力,幫助用戶及時了解應用系統的運行狀態、性能、異常,防患于未然。
View details該企業預采購一套高效穩定的運維監控平臺,用于排除一系列運維障礙。于是客戶找到了尊龍時凱,希望我們幫助其打造一套專業的解決方案。
View details