熱門搜索 Zabbix技術(shù)資料 Zabbix常見(jiàn)問(wèn)、答討論 成功案例 Zabbix交流區(qū) Prometheus交流區(qū)
客戶企業(yè)是一家在香港聯(lián)合交易所主板上市的投資公司。公司主要投資建設(shè)和經(jīng)營(yíng)城市燃?xì)夤艿谰W(wǎng)絡(luò),提供管道安裝及施工服務(wù),并為工商業(yè)企業(yè)和城市居民提供天然氣、液化石油氣。
作為一家大型燃?xì)夤?yīng)和分發(fā)企業(yè),一方面,燃?xì)夤?yīng)的安全性和穩(wěn)定性直接關(guān)乎人民群眾的生命財(cái)產(chǎn)安全,同時(shí)關(guān)系到工商企業(yè)生產(chǎn)服務(wù)的穩(wěn)定性與連續(xù)性等,對(duì)設(shè)備和系統(tǒng)的高可用性具有非常高的要求。另一方面,客戶企業(yè)擁有復(fù)雜的管網(wǎng)系統(tǒng),包括輸氣管道、調(diào)壓站和用戶終端等,涉及到維護(hù)管道的完整性、監(jiān)測(cè)管網(wǎng)壓力、及時(shí)排查和修復(fù)管道泄漏等,面臨著龐大的燃?xì)夤芫W(wǎng)、設(shè)備和系統(tǒng)的管理挑戰(zhàn)。
為解決上述痛點(diǎn),滿足客戶企業(yè)的運(yùn)維需求,尊龍時(shí)凱結(jié)合該企業(yè)現(xiàn)有信息化架構(gòu),提出了建設(shè)智能化統(tǒng)一監(jiān)控平臺(tái)的方案。方案部署情況如下:
1.集中監(jiān)控:包括從IT基礎(chǔ)架構(gòu)到業(yè)務(wù)系統(tǒng)的可用性、性能、日志等指標(biāo)監(jiān)控;
2.集中告警:集中告警展示、告警分發(fā)、告警處理等全生命周期管理;
3.可視化:可自動(dòng)發(fā)現(xiàn)的網(wǎng)絡(luò)拓?fù)?、業(yè)務(wù)地圖、投屏視圖、圖形視圖、一覽視圖等可視化功能;
4.多樣性報(bào)表:支持自定義、多維度、多指標(biāo)報(bào)表統(tǒng)計(jì)功能。
尊龍時(shí)凱項(xiàng)目團(tuán)隊(duì)對(duì)客戶IT資源狀況進(jìn)行梳理,確定項(xiàng)目所涉及的監(jiān)控對(duì)象包括主機(jī)、網(wǎng)絡(luò)設(shè)備、數(shù)據(jù)庫(kù)、中間件、應(yīng)用、業(yè)務(wù)系統(tǒng)、存儲(chǔ)、虛擬化等,決定為客戶打造以統(tǒng)一門戶為中心的集中監(jiān)控。
監(jiān)控對(duì)象與指標(biāo)詳情
主機(jī)系統(tǒng):IP地址,系統(tǒng)類型、業(yè)務(wù)名稱等
網(wǎng)絡(luò)設(shè)備:設(shè)備名稱、設(shè)備類型、設(shè)備團(tuán)體名、管理IP
數(shù)據(jù)庫(kù):數(shù)據(jù)庫(kù)類型、數(shù)據(jù)庫(kù)版本、監(jiān)聽(tīng)端口、實(shí)例名
中間件:中間件類型、中間件版本、部署路徑、IP地址,服務(wù)端口
虛擬化:虛擬化類型、型號(hào)、管理IP地址,用于監(jiān)控的賬號(hào)密碼
服務(wù)器:服務(wù)器品牌、型號(hào)、帶外管理地址、團(tuán)體名
存儲(chǔ):存儲(chǔ)品牌、型號(hào)、管理口地址、團(tuán)體名、用于監(jiān)控的賬號(hào)密碼
……
一般地,企業(yè)的信息化系統(tǒng)不是一次性建成、一成不變的,不少資源廠商出廠自帶監(jiān)控系統(tǒng),這就導(dǎo)致了整個(gè)監(jiān)控體系分散,各自監(jiān)控各自設(shè)備,運(yùn)維人員進(jìn)行巡檢工作時(shí)需要切換不同的監(jiān)控工具,增加工作量的同時(shí)還容易遺漏故障信息。
集中監(jiān)控是最高效的監(jiān)控。統(tǒng)一門戶提供了一個(gè)集中監(jiān)控視圖,運(yùn)維人員可以在一個(gè)界面上查看和管理多個(gè)系統(tǒng)、設(shè)備或應(yīng)用程序的狀態(tài)和指標(biāo)。例如,對(duì)服務(wù)器的監(jiān)控,統(tǒng)一門戶可以做到將不同品牌、不同型號(hào)的服務(wù)器進(jìn)行統(tǒng)一納管和展示。
同時(shí),當(dāng)發(fā)生故障或異常時(shí),運(yùn)維人員可以迅速定位問(wèn)題,而不需要逐個(gè)檢查每個(gè)系統(tǒng)。這使得故障診斷和響應(yīng)更加迅速和高效,有助于減少停機(jī)時(shí)間和服務(wù)中斷。
客戶企業(yè)監(jiān)控對(duì)象為包括涵蓋了操作系統(tǒng)、網(wǎng)絡(luò)設(shè)備、數(shù)據(jù)庫(kù)、中間件、虛擬化、服務(wù)器、存儲(chǔ),總體監(jiān)控對(duì)象在500以內(nèi)。
鑒于客戶對(duì)業(yè)務(wù)安全與穩(wěn)定性的要求,尊龍時(shí)凱方案專家團(tuán)隊(duì)本次系統(tǒng)架構(gòu)部署如下:
采集服務(wù)器采用主備配置。主備系統(tǒng)可以提供冗余的監(jiān)控功能,當(dāng)主監(jiān)控系統(tǒng)發(fā)生故障或不可用時(shí),備用系統(tǒng)能夠自動(dòng)接管監(jiān)控任務(wù),有效提高系統(tǒng)的可靠性、連續(xù)性和安全性,減少停機(jī)時(shí)間,并支持業(yè)務(wù)的連續(xù)性。
引入集中監(jiān)控之外,尊龍時(shí)凱為客戶企業(yè)打造了配套的集中告警功能。
在原有的運(yùn)維體系中,客戶企業(yè)由于告警信息分散,難免出現(xiàn)異常被忽略的情況;而且由于運(yùn)維人員不可能不間斷地開(kāi)展巡檢工作,因此巡檢間隙產(chǎn)生的告警存在解決滯后的情況。
借助集中監(jiān)控推送的數(shù)據(jù),得以實(shí)現(xiàn)集中告警展示、告警分發(fā)、告警處理等全生命周期管理;當(dāng)系統(tǒng)出現(xiàn)故障、達(dá)到閾值或發(fā)生重要事件時(shí),運(yùn)維人員只需要通過(guò)一個(gè)通知系統(tǒng)就可以收到來(lái)自不同資源的告警信息,而無(wú)需關(guān)注多個(gè)獨(dú)立的告警系統(tǒng)。
此外,告警管理模塊還提供了實(shí)時(shí)告警、全部告警、告警統(tǒng)計(jì)、告警升級(jí)及多方式告警通知等功能,支持郵件、短信、企微、釘釘、腳本等多種告警通知方式,一旦出現(xiàn)告警信息解決遲滯,告警信息將向上傳遞到上一級(jí)運(yùn)維管理人員。
由于原有的監(jiān)控系統(tǒng)分散、不成體系,運(yùn)維人員無(wú)法感知資源間的關(guān)聯(lián)關(guān)系,當(dāng)故障發(fā)生的時(shí)候,不能快速評(píng)估故障節(jié)點(diǎn)可能帶來(lái)的關(guān)聯(lián)影響。為此,尊龍時(shí)凱為客戶打造以網(wǎng)絡(luò)拓?fù)錇橹行牡目梢暬δ荏w系,提供一覽視圖、業(yè)務(wù)拓?fù)?、投屏視圖等功能。
網(wǎng)絡(luò)拓?fù)涿枋隽司W(wǎng)絡(luò)中設(shè)備之間的物理或邏輯連接方式和結(jié)構(gòu)布局,通過(guò)網(wǎng)絡(luò)拓?fù)淇芍庇^的看到當(dāng)前網(wǎng)絡(luò)健康狀況,以及設(shè)備之間的通信路徑和數(shù)據(jù)流動(dòng)方式。當(dāng)網(wǎng)絡(luò)中某個(gè)設(shè)備或鏈路出現(xiàn)故障時(shí),拓?fù)浣Y(jié)構(gòu)可以幫助確定故障的范圍和影響。
更重要的是,系統(tǒng)提供網(wǎng)絡(luò)拓?fù)涞膌ldp配置功能,可以實(shí)現(xiàn)網(wǎng)絡(luò)拓?fù)渥詣?dòng)發(fā)現(xiàn)、自動(dòng)關(guān)聯(lián)網(wǎng)絡(luò)設(shè)備并生成拓?fù)鋱D。
方案還引入報(bào)表管理系統(tǒng),提供實(shí)時(shí)報(bào)表、TOPN報(bào)表、流量報(bào)表與日?qǐng)?bào)周報(bào)等功能,支持自定義、多維度、多指標(biāo)報(bào)表統(tǒng)計(jì)。
案例客戶原有的運(yùn)維系統(tǒng)缺乏故障預(yù)判能力,解決這一問(wèn)題的關(guān)鍵就在于報(bào)表系統(tǒng)。
實(shí)時(shí)報(bào)表可以提供對(duì)系統(tǒng)性能的實(shí)時(shí)監(jiān)測(cè)、并對(duì)系統(tǒng)狀態(tài)的即時(shí)反饋。當(dāng)監(jiān)控指標(biāo)達(dá)到或超過(guò)設(shè)定的閾值時(shí),實(shí)時(shí)報(bào)表可以發(fā)出警示,指引運(yùn)維人員及時(shí)解決潛在的故障或問(wèn)題,從而降低系統(tǒng)停機(jī)時(shí)間和服務(wù)中斷的風(fēng)險(xiǎn);運(yùn)維人員可以隨時(shí)查看關(guān)鍵性能指標(biāo)的變化趨勢(shì),透過(guò)趨勢(shì)情況,迅速發(fā)現(xiàn)性能瓶頸、資源緊張或異常行為,從而采取相應(yīng)的優(yōu)化措施,提高系統(tǒng)的性能和響應(yīng)能力。
借助TOPN報(bào)表,運(yùn)維人員可以快速識(shí)別出系統(tǒng)中的關(guān)鍵問(wèn)題或異常,確定優(yōu)化重點(diǎn),監(jiān)測(cè)趨勢(shì)和變化、進(jìn)行資源分配和規(guī)劃以及進(jìn)行容量規(guī)劃和預(yù)測(cè)。例如,通過(guò)查看CPU利用率的TOPN報(bào)表,可以確定哪些進(jìn)程或任務(wù)占用了大量的CPU資源,從而找到導(dǎo)致性能下降或系統(tǒng)負(fù)載過(guò)高的根本原因。
此外,運(yùn)維人員還可根據(jù)不同業(yè)務(wù)場(chǎng)景、不同情況進(jìn)行自定義報(bào)表配置。
根據(jù)尊龍時(shí)凱方案建成統(tǒng)一監(jiān)控平臺(tái)后,案例客戶實(shí)現(xiàn)了對(duì)管網(wǎng)和設(shè)備產(chǎn)生大量的數(shù)據(jù),包括壓力、流量、溫度等指標(biāo)數(shù)據(jù)的實(shí)時(shí)監(jiān)測(cè)、存儲(chǔ)和分析,并籍此獲得有關(guān)設(shè)備運(yùn)行狀況、性能趨勢(shì)和故障預(yù)測(cè)的洞察。這有助于進(jìn)行預(yù)防性維護(hù)和優(yōu)化管網(wǎng)運(yùn)行,提高設(shè)備的可靠性和效率。
當(dāng)監(jiān)控平臺(tái)檢測(cè)到設(shè)備或系統(tǒng)發(fā)生故障或異常時(shí),借助集中告警與可視化工具,運(yùn)維人員可以迅速地定位問(wèn)題和進(jìn)行故障診斷。通過(guò)監(jiān)測(cè)和分析相關(guān)的數(shù)據(jù)和日志,運(yùn)維人員可以更快地了解故障的根源,并采取相應(yīng)的糾正措施,以減少故障持續(xù)時(shí)間和生產(chǎn)中斷。
T系統(tǒng)已經(jīng)成為企業(yè)運(yùn)營(yíng)的核心支撐。為了確保IT系統(tǒng)的穩(wěn)定運(yùn)行和高效管理,選擇一款合適的 IT監(jiān)控平臺(tái)至關(guān)重要。
View details該企業(yè)預(yù)采購(gòu)一套高效穩(wěn)定的運(yùn)維監(jiān)控平臺(tái),用于排除一系列運(yùn)維障礙。于是客戶找到了尊龍時(shí)凱,希望我們幫助其打造一套專業(yè)的解決方案。
View details制造業(yè)運(yùn)維監(jiān)控案例實(shí)踐解析
View details尊龍時(shí)凱為該公司部署了集中監(jiān)控、集中告警、可視化試圖、多樣性報(bào)表和大屏展示等功能。
View details本次項(xiàng)目主要包括了底層基礎(chǔ)設(shè)施監(jiān)控和告警推送、運(yùn)維服務(wù)管理等,底層基礎(chǔ)資源監(jiān)控為各類品牌服務(wù)器硬件的運(yùn)行狀態(tài)和可用性監(jiān)控。
View details數(shù)字政務(wù)在全國(guó)范圍內(nèi)加速推進(jìn),不斷提升政府部門的政務(wù)服務(wù)水平與效率。針對(duì)數(shù)字政府建設(shè)帶來(lái)的運(yùn)維層面問(wèn)題,尊龍時(shí)凱打造集監(jiān)控、日志管理、資產(chǎn)管理于一體的...
View details制造業(yè)運(yùn)維監(jiān)控案例實(shí)踐解析
View details尊龍時(shí)凱監(jiān)控結(jié)合該銀行發(fā)展在的現(xiàn)狀及發(fā)展需求,幫助其構(gòu)建一個(gè)安全、實(shí)用、可持續(xù)發(fā)展的智能監(jiān)控管理平臺(tái)。
View details尊龍時(shí)凱從基礎(chǔ)資源、中間件、數(shù)據(jù)庫(kù)、到第三方系統(tǒng),提供全方位、快速關(guān)聯(lián)的監(jiān)控管理和分析能力,幫助用戶及時(shí)了解應(yīng)用系統(tǒng)的運(yùn)行狀態(tài)、性能、異常,防患于未然。
View details