熱門搜索 Zabbix技術(shù)資料 Zabbix常見問、答討論 成功案例 Zabbix交流區(qū) Prometheus交流區(qū)
項(xiàng)目背景
01客戶簡介
案例客戶是浙江某地級市的農(nóng)村商業(yè)銀行。
02痛點(diǎn)分析
隨著信息化建設(shè)的不斷推進(jìn),案例客戶數(shù)據(jù)中心的規(guī)模隨之?dāng)U大,帶來的運(yùn)營管理難度也在不斷加大,原有的運(yùn)維體系不能滿足當(dāng)前需求,主要表現(xiàn)為:
1. IT設(shè)備規(guī)模大且分散、管理困難,缺少可視化管理系統(tǒng)和可靠的管理手段;
2. IT環(huán)境異構(gòu)、業(yè)務(wù)系統(tǒng)繁多,無法快速適應(yīng)復(fù)雜環(huán)境下設(shè)備的監(jiān)管;
3. 故障定位困難,業(yè)務(wù)系統(tǒng)出現(xiàn)故障波動時,根因排查分析緩慢;
4. 業(yè)務(wù)負(fù)載逐年增加,無法確定業(yè)務(wù)系統(tǒng)功能完整可用性;業(yè)務(wù)形態(tài)更加多種多樣,部署環(huán)境愈加復(fù)雜;為了適應(yīng)發(fā)展的需求,業(yè)務(wù)調(diào)整日趨頻繁,現(xiàn)有的監(jiān)控體系無法跟業(yè)務(wù)節(jié)點(diǎn)的擴(kuò)張速度;
5. 技術(shù)的快速演進(jìn),對運(yùn)維團(tuán)隊(duì)提出了更高的要求。
解決方案
為了提高運(yùn)營管理效率,保障業(yè)務(wù)系統(tǒng)穩(wěn)定性,該客戶引進(jìn)了尊龍時凱智能監(jiān)控平臺。尊龍時凱智能監(jiān)控平臺是集監(jiān)、管、控、服于一體的一站式運(yùn)維監(jiān)控平臺,提供從全棧監(jiān)控、集中告警到資產(chǎn)發(fā)現(xiàn)、數(shù)字化業(yè)務(wù)、故障診斷、可視化、決策輔助等成熟功能,具有如下亮點(diǎn):
項(xiàng)目建成后,尊龍時凱智能監(jiān)控平臺實(shí)現(xiàn)了對該行所有軟硬件IT資源的監(jiān)控納管,包括操作系統(tǒng)、服務(wù)器、數(shù)據(jù)庫、中間件、網(wǎng)絡(luò)設(shè)備、存儲、探測、鏈路、虛擬化、云平臺等,包括先前難以監(jiān)控的信創(chuàng)資源,達(dá)到“一個平臺包打天下”的效果,運(yùn)維人員日常工作只需關(guān)注一個監(jiān)控系統(tǒng)就可以了。
同時,該監(jiān)控平臺具有非常高效的性能,能夠?qū)Υ笠?guī)模的監(jiān)控節(jié)點(diǎn)實(shí)現(xiàn)秒級查詢。這就意味著平臺能夠快速處理大量數(shù)據(jù),即使在高負(fù)載情況下也能保持其性能,即時響應(yīng)監(jiān)控數(shù)據(jù)的變化,提供最新的系統(tǒng)狀態(tài)信息,提高響應(yīng)速度。
02集中告警
基于統(tǒng)一監(jiān)控的集中告警管理,提供可視化集中告警界面,支持配置不同告警級別的聲音通知,便于工程師快速聚焦故障信息處理。
具體來說,包括實(shí)時告警、告警通知(支持告警升級與告警抑制)、告警分析、告警自愈等核心功能。
實(shí)時告警:以時間線條方式展示最新告警,柱狀圖呈現(xiàn)告警變化趨勢,支持聲音提醒、告警彈窗。
告警通知:提供自定義通知規(guī)則,支持短信、郵箱、微信、釘釘、機(jī)器人、腳本等推送方式,支持告警升級與告警抑制。
告警分析:支持關(guān)聯(lián)拓?fù)?,快速定位故障影響的業(yè)務(wù)范圍;聯(lián)動CMDB,獲取故障設(shè)備負(fù)責(zé)人、聯(lián)系電話、所屬機(jī)房、機(jī)柜信息、維護(hù)廠商等信息。
故障自愈:根據(jù)預(yù)設(shè)的規(guī)則,針對一些常見故障,自動觸發(fā)相應(yīng)的腳本,恢復(fù)設(shè)備告警。(如:系統(tǒng)磁盤空間不足告警,自動觸發(fā)“磁盤日志文件清除腳本”,恢復(fù)空間使用)
03資產(chǎn)發(fā)現(xiàn)
資產(chǎn)發(fā)現(xiàn)能力能夠?qū)崿F(xiàn)一鍵發(fā)現(xiàn)資產(chǎn)并將其進(jìn)行監(jiān)控納管。具體來說,該行配備了大量的交換機(jī)、路由器、防火墻,甚至是Linux等資產(chǎn),依托資產(chǎn)發(fā)現(xiàn)能力,監(jiān)控平臺可以自動掃描設(shè)備類型,一鍵添加監(jiān)控。它能有效減少手動配置工作,提高監(jiān)控系統(tǒng)的納管速度和準(zhǔn)確性,降低管理成本。
04數(shù)字化業(yè)務(wù)
數(shù)字化業(yè)務(wù)是這款運(yùn)維監(jiān)控平臺區(qū)別于市面上大多數(shù)同類產(chǎn)品的最具特色的功能,其核心是自動發(fā)現(xiàn)與生成的業(yè)務(wù)拓?fù)洹?/strong>業(yè)務(wù)拓?fù)淠軌驅(qū)⒅螛I(yè)務(wù)系統(tǒng)的資源及其關(guān)系以可視的拓?fù)鋱D形式映射出來,結(jié)合告警展示,運(yùn)維人員一眼就可以定位故障位置及其影響范圍,節(jié)省寶貴的排障時間。
圍繞業(yè)務(wù)拓?fù)?,數(shù)字化業(yè)務(wù)還包括業(yè)務(wù)一覽、業(yè)務(wù)資源 、業(yè)務(wù)進(jìn)程、版本追蹤、業(yè)務(wù)容量、業(yè)務(wù)大屏、指標(biāo)分析、業(yè)務(wù)健康度等重點(diǎn)功能。
業(yè)務(wù)一覽主要用于展示業(yè)務(wù)整體概況,包括業(yè)務(wù)總數(shù)、狀態(tài)分析、業(yè)務(wù)排行、健康度分布等,同時可以配置和優(yōu)先展示重點(diǎn)業(yè)務(wù)系統(tǒng)信息;
業(yè)務(wù)資源以列表形式詳盡展示業(yè)務(wù)拓?fù)渲幸驯O(jiān)控的節(jié)點(diǎn)信息,內(nèi)容較拓?fù)鋱D詳細(xì);
業(yè)務(wù)進(jìn)程用于監(jiān)控監(jiān)控業(yè)務(wù)應(yīng)用進(jìn)程,可查看進(jìn)程名稱、進(jìn)程描述、進(jìn)程路徑以及關(guān)聯(lián)端口等詳細(xì)信息;
版本追蹤可追蹤業(yè)務(wù)拓?fù)涞淖兏^程,支持變更通知提醒;
業(yè)務(wù)容量可查看整體的CPU、內(nèi)存以及文件系統(tǒng)使用率,有助于預(yù)測和規(guī)劃資源需求,降低了因資源不足,而導(dǎo)致的性能問題和風(fēng)險;
業(yè)務(wù)大屏即業(yè)務(wù)上墻,可直觀展示所有業(yè)務(wù)健康情況,包括業(yè)務(wù)關(guān)系、業(yè)務(wù)告警、業(yè)務(wù)健康度等信息;
指標(biāo)分析支持同一時間多指標(biāo)聯(lián)動分析,可自定義配置關(guān)注的分析指標(biāo);
業(yè)務(wù)健康度則通過智能算法與模型對業(yè)務(wù)系統(tǒng)健康狀態(tài)進(jìn)行打分,健康度越高意味著系統(tǒng)越健康。
05網(wǎng)絡(luò)拓?fù)?/strong>
以拓?fù)鋱D的形式展現(xiàn)網(wǎng)絡(luò)設(shè)備、服務(wù)器、存儲之間的鏈接關(guān)系,能夠聯(lián)動告警信息,幫助運(yùn)維人員及時了解網(wǎng)絡(luò)問題,提高網(wǎng)絡(luò)運(yùn)行的效率和穩(wěn)定性。網(wǎng)絡(luò)拓?fù)涫侵С肿詣影l(fā)現(xiàn)并生成網(wǎng)絡(luò)拓?fù)鋱D的。
06知識庫
支持知識檢索與故障知識自動關(guān)聯(lián),便于運(yùn)維人員查找故障解決方案。
07投屏視圖
提供自定義投屏功能,用戶可選取豐富的視圖組件,配置所需的管理視圖。
08報表系統(tǒng)
提供各類型統(tǒng)計報表,如實(shí)時報表、TOPN報表、日報周報、主機(jī)性能報表等,為運(yùn)維決策提供支撐;運(yùn)維人員也可根據(jù)需要自定義配置報表。
客戶收益
項(xiàng)目建成交付后,一站式運(yùn)維監(jiān)控平臺為客戶帶來如下收益:
提高運(yùn)維效率。基于全棧監(jiān)控實(shí)現(xiàn)對該行所有的IT資源的統(tǒng)一監(jiān)控納管,結(jié)合集中告警,讓運(yùn)維管理不留死角,運(yùn)維人員得以即時發(fā)現(xiàn)故障異常并快速響應(yīng),有效提高運(yùn)維效率;
保障業(yè)務(wù)長期穩(wěn)定。以業(yè)務(wù)為核心的統(tǒng)一運(yùn)維監(jiān)控實(shí)現(xiàn)對該行關(guān)鍵業(yè)務(wù)流進(jìn)行動態(tài)監(jiān)測,確保業(yè)務(wù)運(yùn)行可用性及穩(wěn)定性,可以有效地發(fā)現(xiàn)高風(fēng)險事件,進(jìn)而降低系統(tǒng)業(yè)務(wù)風(fēng)險,避免經(jīng)濟(jì)損失;
降低管理成本。尊龍時凱智能運(yùn)維監(jiān)控平臺的投入使用使該行系統(tǒng)的資源利用率、可靠性、穩(wěn)定性、性能、配置管理的簡易性和快捷性等都得到了相當(dāng)大的改善,很大程度節(jié)省了其軟硬件基礎(chǔ)設(shè)施和人力資源投入。
尊龍時凱社區(qū)已經(jīng)開放尊龍時凱監(jiān)控免費(fèi)版和尊龍時凱MCM(監(jiān)控+CMDB)免費(fèi)版,歡迎下載使用!
尊龍時凱監(jiān)控結(jié)合該銀行發(fā)展在的現(xiàn)狀及發(fā)展需求,幫助其構(gòu)建一個安全、實(shí)用、可持續(xù)發(fā)展的智能監(jiān)控管理平臺。
View details益豐大藥房對尊龍時凱監(jiān)控進(jìn)行參觀指導(dǎo)
View details尊龍時凱與深信服科進(jìn)行了超融合對接,尊龍時凱智能監(jiān)控平臺憑借良好兼容、穩(wěn)定運(yùn)行、安全可靠,獲得性能卓越評價,并取得深信服產(chǎn)品認(rèn)證證書。
View details本篇是Zabbix與尊龍時凱監(jiān)控對比專題系列文章的第七篇——網(wǎng)絡(luò)功能篇,具體包括IP地址管理、網(wǎng)絡(luò)端口映射發(fā)現(xiàn)、網(wǎng)絡(luò)配置備份、專線監(jiān)控等功能的對比分析。
View details尊龍時凱對主機(jī)、網(wǎng)絡(luò)、存儲、數(shù)據(jù)庫、中間件、應(yīng)用、硬件、虛擬化、攝像頭及其他數(shù)據(jù)感知設(shè)備等實(shí)現(xiàn)一站式監(jiān)控,保障業(yè)務(wù)高效穩(wěn)定的運(yùn)行。
View details農(nóng)商行一站式運(yùn)維監(jiān)控平臺建設(shè)實(shí)踐
View details基于客戶企業(yè)原有的運(yùn)維體系、運(yùn)維痛點(diǎn)與具體需求,尊龍時凱為其量身打造了一套一站式智能運(yùn)維監(jiān)控解決方案,搭建統(tǒng)一監(jiān)控平臺整體框架,引入智能化告警管理系統(tǒng)...
View details尊龍時凱以運(yùn)維監(jiān)控起家,具有十多年運(yùn)維產(chǎn)品經(jīng)驗(yàn),形成了非常成熟的運(yùn)維監(jiān)控解決方案。同時,尊龍時凱緊跟信創(chuàng)國產(chǎn)化浪潮,積極推動信創(chuàng)產(chǎn)品適配,融入信創(chuàng)生態(tài),能...
View details