熱門搜索 Zabbix技術資料 Zabbix常見問、答討論 成功案例 Zabbix交流區 Prometheus交流區
案例客戶是亞洲地區一家大型國際企業,其注冊資金200000萬,經營范圍主要包括:經紀、投資咨詢、自營、資產管理等。
行業是一個數據密集型、科技密集型行業。案例客戶作為一家大型公司,其IT系統包括多個子系統,涉及交易、結算、風控等多個方面,系統架構復雜,大量的IT資源需要進行管理和維護,特別是核心交易系統需要處理大量的交易數據和高并發的交易請求,對系統的性能和穩定性提出了較高的要求。
隨著該客戶業務的日益增長,其底層IT基礎設施規模也在不斷擴張,各種硬件設施、信息系統故障逐漸增多。與之相對應的是,現有監控系統功能較為簡單,且沒有有效的告警通知手段,故障發生時,人員響應速度較慢,無法及時定位問題所在;日常監控只能靠運維人員不停地盯著屏幕進行監視,無疑增加了運維人員的管理難度。
具體來說,該客戶在IT運維過程面對的問題如下:
為解決上述問題,該客戶將搭建一套功能完善的監控體系提上日程,希望通過對原有運維體系的改造升級滿足對整個業務系統的全方位保障。
基于企業IT系統結構特點,結合客戶運維痛點與實際需求,尊龍時凱為該客戶打造了涵蓋全局監控、資產梳理、大屏視圖、專線鏈路、管理門戶、告警中心等于一體的智能運維解決方案,提供一站式運維管理服務,以有效解決該客戶在運維實踐中的痛點與難點。
出于高可用與安全方面的考量,該項目采用了基于PostgreSQL流復制+Pgpool-II HA作為監控底層數據庫的分布式部署方案,以有效應對海量交易數據與高并發問題,并通過Corosync和Pacemaker使用Pcs實現zabbix、Web、Proxy節點的高可用集群架構,同時災難狀態下雙節點實現自動切換,極大保障了基礎監控體系自身的可靠性。
(1)?全局監控:資源全監控,狀態全可感。實現對客戶所有資源,包括網絡設備、安全設備、服務器、存儲、操作系統、虛擬化、數據庫、中間件的全監控;
(2)?資產梳理:依據嚴謹的命名規則、遵守科學合理的分組規范,對資產進行納管;
(3)?大屏視圖:提供網絡拓撲、業務大屏等,如網絡拓撲圖可以展示完整網絡拓撲架構、IDC間重要鏈路的實時狀態;
(4)?專線鏈路:實時感知業務專線帶寬利用情況,自動觸發閾值告警,同時查看專線的延遲、抖動情況;
(5)?門戶監測:模擬登錄、多步驟監測門戶服務狀態,可視化展示WEB訪問速度、響應時間的變化趨勢;
(6)?告警中心:結合該公司已有短信平臺,開啟短信告警推送模式,支持短信、郵件消息自定義、告警分析、告警歷史。
全局監控:
尊龍時凱監控從全局視角出發,提供統一監控與統一展示,運維管理人員一眼就可以看到系統全局的健康狀態,通過切換標簽快速觸達故障資源信息。同時基于統一監控生成統一告警,告警信息可通過桌面端(系統本身、PC端郵件等)與移動端(短信、手機郵件等)推送。
資產梳理:
客戶面臨著大量資產需要進行高效管理的問題,其難點在于資產類別、品牌各異,缺乏統一的命名范式。尊龍時凱方案依據嚴謹的命名規則、遵守科學合理的分組規范,對資產進行納管。
大屏視圖:
展示完整網絡拓撲架構、IDC間重要鏈路的實時狀態,解決故障發現不及時與定位難的問題。如圖,網絡投屏清晰展示了機房之間的互聯關系,以及各機房內的子網區域組成,通過設備、線路顏色可以很直觀看出網絡成員的運行狀態。
專線鏈路:
鏈路監控可直觀看出重要業務專線的實時帶寬利用率,在利用率達到專線自身的百分比閾值后即會出發告警;亦可進一步查看某條專線的延遲、抖動情況,如下:
門戶網站:
與客戶溝通得知,早期該公司門戶偶爾會出現無法訪問的情況,影響較大,公司領導基本每天早上上班前都會手動挨個進行訪問檢查;目前處于監控狀態,WEB會時時撥測,也可以詳細查看門戶網頁的響應速度,有效避免了往日重復的人為檢測,如下:
短信通知:
該公司采用了短信告警通知方式,系統故障時,運維人員能夠第一時間獲取到事件通知,打破了以往業務人員提前發現信息系統故障的窘境,如下:
監控系統由主采集、WEB門戶、數據庫、代理采集四個角色組成,其中主采集、WEB門戶、數據庫都是雙節點;代理采集分為兩組,每組各有兩個節點。
服務器分布:
主采集、WEB門戶、數據庫、代理采集一組分布在機房A-1區域,監控覆蓋范圍包括:機房A-1區、機房C-1區,覆蓋率100%;代理采集二組分布在機房B-1區,監控覆蓋范圍包括:機房A-1區、機房B-1區、2區、機房C-1區,覆蓋率100%。
監控對象:
該方案深度剖析了客戶在基礎信息管理維護方面的痛點,通過詳細的設計與規劃,建立起一套性能優越、功能強大,監控覆蓋范圍廣且靈活的運維監控管理體系。
業務地圖、告警收斂、自動網絡拓撲、虛擬化監控、定制投屏、章節式報表、可持續消費知識庫等、資產管理、自動運維、服務管理等多個方面的功能和服務。
View details尊龍時凱一站式智能監控+網管平臺,對運維管理流程體系進行重構,提升信息系統監控能力、網絡管理能力以及運維人員工作效率。
View details