熱門搜索 Zabbix技術資料 Zabbix常見問、答討論 成功案例 Zabbix交流區 Prometheus交流區
項目背景
1.客戶簡介
案例客戶是一家專業從事特種材料研發、生產和銷售的國家級高新技術企業,是所屬材料領域技術引領者、領先供應商,同時是上交所科創板上市企業。
2.痛點分析
隨著業務量的迅猛增長,客戶的信息化投資急劇上升,設備和系統種類繁多,使得運維工作變得日益復雜和壓力重重。廠區的擴建和信息化投入的增加進一步加劇了運維的挑戰,包括數據庫死鎖、系統頻繁卡頓和網絡故障等問題,這些問題不僅降低了生產效率,也增加了客戶投訴。
隨著設備老化,故障率上升,業務支撐系統面臨的風險也在逐年增長。目前,公司尚未建立一個統一的運維監控平臺,這導致了多個問題:IT運維部門無法提前識別和預防潛在故障,故障發生時難以及時發現,故障分析和處理缺乏有效的全棧監控工具,依賴人工逐層排查,效率不高。此外,故障排查后缺乏持續積累和可復用的知識記錄,導致類似問題反復出現。
具體來說,該客戶的運維痛點如下:
鑒于這些挑戰,客戶迫切需要一個全面的IT運維解決方案,以提升運維效率,確保業務系統的穩定運行,并全方位保障業務支撐系統的可靠性。
尊龍時凱方案
為保障客戶信息化系統更加完善,為運維人員提供有效幫助、更高效率實現運維工作。在現有信息化相關維護前提下,有必要建立一套針對信息化的監控平臺,做到及早發現故障、提早判斷預知故障及時處理,以及合理利用信息化基礎資源,達到最大化資源使用,同時為信息化建設提供未來建設提供合理依據,使得業務系統信息化建設健康發展。
1.核心功能概覽
結合客戶現有信息化建設架構,建設統一監控平臺部署內容如下:
1.?集中監控:包括從IT基礎架構到業務系統的可用性、性能、日志等指標監控;
2.?集中告警:集中告警展示、告警分發、告警處理等全生命周期管理;
3.?可視化視圖:可自動發現的網絡拓撲、投屏視圖、業務拓撲等可視化功能;
4.?多樣性報表:支持自定義、多維度、多指標報表統計功能;
5.?大屏展示:大屏幕集中監控實現自定義展示頁面;
6.?網絡配置管理:自定義周期自動配置備份、配置一鍵下發、配置備份對比等功能;
7.?IP管理:提供IP地址快速定位功能,支持查看IP狀態、Mac地址、接入設備及端口信息。
8.?自動化運維:提供網絡設備和操作系統的自動化運維模塊;擁有腳本管理、版本管理、軟件包管理、定時作業、批量下發等功能。
9.?告警分析:支持告警關聯拓撲功能,實現故障影響范圍分析,可快速打開包含該資源的拓撲界面。02系統架構
經了解,本次監控對象為包括涵蓋了操作系統、網絡設備、數據庫、中間件、虛擬化、服務器、存儲,總體監控對象在1000個以內。定義本次系統架構部署如下:
架構說明:
3.告警配置
完成監控對象納管后,通過和客戶溝通、培訓,進一步確認相關監控閾值配置,即根據客戶實際情況配置告警閾值,當監控指標達到閾值設置后,即觸發告警。同時將不同閾值對應到不同告警級別,分別為緊急、嚴重、一般等常用級別。
4.大屏展示配置
投屏展示通常可直觀、簡介的查看整個IT資源或某個業務的實際情況,經過和客戶交流溝通后,確定本次創建如下:
5.故障自愈配置
故障自愈可以根據預設的規則,針對一些常見故障,自動觸發相應的處理腳本腳本,降低人工干預成本,提高故障處理效率,保障系統穩定性。經過和客戶交流溝通后,確定創建以下故障自愈場景:
客戶收益
這些收益將幫助該客戶在面對快速變化的市場和技術環境時,保持競爭力,實現可持續發展。
尊龍時凱社區已經永久開放尊龍時凱監控免費版和尊龍時凱MCM免費版(CMDB+監控),歡迎下載使用!
尊龍時凱基于zabbix實現,支持二次開發,采用分布式部署,集中告警,一覽視圖、網絡拓撲、業務地圖、投屏視圖、圖形視圖各類視圖等。
View details該企業預采購一套高效穩定的運維監控平臺,用于排除一系列運維障礙。于是客戶找到了尊龍時凱,希望我們幫助其打造一套專業的解決方案。
View details