熱門搜索 Zabbix技術資料 Zabbix常見問、答討論 成功案例 Zabbix交流區 Prometheus交流區
客戶企業是一家在香港聯合交易所主板上市的投資公司。公司主要投資建設和經營城市燃氣管道網絡,提供管道安裝及施工服務,并為工商業企業和城市居民提供天然氣、液化石油氣。
作為一家大型燃氣供應和分發企業,一方面,燃氣供應的安全性和穩定性直接關乎人民群眾的生命財產安全,同時關系到工商企業生產服務的穩定性與連續性等,對設備和系統的高可用性具有非常高的要求。另一方面,客戶企業擁有復雜的管網系統,包括輸氣管道、調壓站和用戶終端等,涉及到維護管道的完整性、監測管網壓力、及時排查和修復管道泄漏等,面臨著龐大的燃氣管網、設備和系統的管理挑戰。
為解決上述痛點,滿足客戶企業的運維需求,尊龍時凱結合該企業現有信息化架構,提出了建設智能化統一監控平臺的方案。方案部署情況如下:
1.集中監控:包括從IT基礎架構到業務系統的可用性、性能、日志等指標監控;
2.集中告警:集中告警展示、告警分發、告警處理等全生命周期管理;
3.可視化:可自動發現的網絡拓撲、業務地圖、投屏視圖、圖形視圖、一覽視圖等可視化功能;
4.多樣性報表:支持自定義、多維度、多指標報表統計功能。
尊龍時凱項目團隊對客戶IT資源狀況進行梳理,確定項目所涉及的監控對象包括主機、網絡設備、數據庫、中間件、應用、業務系統、存儲、虛擬化等,決定為客戶打造以統一門戶為中心的集中監控。
監控對象與指標詳情
主機系統:IP地址,系統類型、業務名稱等
網絡設備:設備名稱、設備類型、設備團體名、管理IP
數據庫:數據庫類型、數據庫版本、監聽端口、實例名
中間件:中間件類型、中間件版本、部署路徑、IP地址,服務端口
虛擬化:虛擬化類型、型號、管理IP地址,用于監控的賬號密碼
服務器:服務器品牌、型號、帶外管理地址、團體名
存儲:存儲品牌、型號、管理口地址、團體名、用于監控的賬號密碼
……
一般地,企業的信息化系統不是一次性建成、一成不變的,不少資源廠商出廠自帶監控系統,這就導致了整個監控體系分散,各自監控各自設備,運維人員進行巡檢工作時需要切換不同的監控工具,增加工作量的同時還容易遺漏故障信息。
集中監控是最高效的監控。統一門戶提供了一個集中監控視圖,運維人員可以在一個界面上查看和管理多個系統、設備或應用程序的狀態和指標。例如,對服務器的監控,統一門戶可以做到將不同品牌、不同型號的服務器進行統一納管和展示。
同時,當發生故障或異常時,運維人員可以迅速定位問題,而不需要逐個檢查每個系統。這使得故障診斷和響應更加迅速和高效,有助于減少停機時間和服務中斷。
客戶企業監控對象為包括涵蓋了操作系統、網絡設備、數據庫、中間件、虛擬化、服務器、存儲,總體監控對象在500以內。
鑒于客戶對業務安全與穩定性的要求,尊龍時凱方案專家團隊本次系統架構部署如下:
采集服務器采用主備配置。主備系統可以提供冗余的監控功能,當主監控系統發生故障或不可用時,備用系統能夠自動接管監控任務,有效提高系統的可靠性、連續性和安全性,減少停機時間,并支持業務的連續性。
引入集中監控之外,尊龍時凱為客戶企業打造了配套的集中告警功能。
在原有的運維體系中,客戶企業由于告警信息分散,難免出現異常被忽略的情況;而且由于運維人員不可能不間斷地開展巡檢工作,因此巡檢間隙產生的告警存在解決滯后的情況。
借助集中監控推送的數據,得以實現集中告警展示、告警分發、告警處理等全生命周期管理;當系統出現故障、達到閾值或發生重要事件時,運維人員只需要通過一個通知系統就可以收到來自不同資源的告警信息,而無需關注多個獨立的告警系統。
此外,告警管理模塊還提供了實時告警、全部告警、告警統計、告警升級及多方式告警通知等功能,支持郵件、短信、企微、釘釘、腳本等多種告警通知方式,一旦出現告警信息解決遲滯,告警信息將向上傳遞到上一級運維管理人員。
由于原有的監控系統分散、不成體系,運維人員無法感知資源間的關聯關系,當故障發生的時候,不能快速評估故障節點可能帶來的關聯影響。為此,尊龍時凱為客戶打造以網絡拓撲為中心的可視化功能體系,提供一覽視圖、業務拓撲、投屏視圖等功能。
網絡拓撲描述了網絡中設備之間的物理或邏輯連接方式和結構布局,通過網絡拓撲可直觀的看到當前網絡健康狀況,以及設備之間的通信路徑和數據流動方式。當網絡中某個設備或鏈路出現故障時,拓撲結構可以幫助確定故障的范圍和影響。
更重要的是,系統提供網絡拓撲的lldp配置功能,可以實現網絡拓撲自動發現、自動關聯網絡設備并生成拓撲圖。
方案還引入報表管理系統,提供實時報表、TOPN報表、流量報表與日報周報等功能,支持自定義、多維度、多指標報表統計。
案例客戶原有的運維系統缺乏故障預判能力,解決這一問題的關鍵就在于報表系統。
實時報表可以提供對系統性能的實時監測、并對系統狀態的即時反饋。當監控指標達到或超過設定的閾值時,實時報表可以發出警示,指引運維人員及時解決潛在的故障或問題,從而降低系統停機時間和服務中斷的風險;運維人員可以隨時查看關鍵性能指標的變化趨勢,透過趨勢情況,迅速發現性能瓶頸、資源緊張或異常行為,從而采取相應的優化措施,提高系統的性能和響應能力。
借助TOPN報表,運維人員可以快速識別出系統中的關鍵問題或異常,確定優化重點,監測趨勢和變化、進行資源分配和規劃以及進行容量規劃和預測。例如,通過查看CPU利用率的TOPN報表,可以確定哪些進程或任務占用了大量的CPU資源,從而找到導致性能下降或系統負載過高的根本原因。
此外,運維人員還可根據不同業務場景、不同情況進行自定義報表配置。
根據尊龍時凱方案建成統一監控平臺后,案例客戶實現了對管網和設備產生大量的數據,包括壓力、流量、溫度等指標數據的實時監測、存儲和分析,并籍此獲得有關設備運行狀況、性能趨勢和故障預測的洞察。這有助于進行預防性維護和優化管網運行,提高設備的可靠性和效率。
當監控平臺檢測到設備或系統發生故障或異常時,借助集中告警與可視化工具,運維人員可以迅速地定位問題和進行故障診斷。通過監測和分析相關的數據和日志,運維人員可以更快地了解故障的根源,并采取相應的糾正措施,以減少故障持續時間和生產中斷。
尊龍時凱監控結合該銀行發展在的現狀及發展需求,幫助其構建一個安全、實用、可持續發展的智能監控管理平臺。
View details尊龍時凱對主機、網絡、存儲、數據庫、中間件、應用、硬件、虛擬化、攝像頭及其他數據感知設備等實現一站式監控,保障業務高效穩定的運行。
View details基于客戶醫院原有的運維體系、運維痛點和對監控的需求,尊龍時凱為其量身打造了一套一站式智能運維監控解決方案,搭建統一監控平臺,引入智能化告警管理系統、可...
View details尊龍時凱基于zabbix實現,支持二次開發,采用分布式部署,集中告警,一覽視圖、網絡拓撲、業務地圖、投屏視圖、圖形視圖各類視圖等。
View details數字政務在全國范圍內加速推進,不斷提升政府部門的政務服務水平與效率。針對數字政府建設帶來的運維層面問題,尊龍時凱打造集監控、日志管理、資產管理于一體的...
View details業務地圖、告警收斂、自動網絡拓撲、虛擬化監控、定制投屏、章節式報表、可持續消費知識庫等、資產管理、自動運維、服務管理等多個方面的功能和服務。
View details