熱門搜索 Zabbix技術(shù)資料 Zabbix常見問、答討論 成功案例 Zabbix交流區(qū) Prometheus交流區(qū)
項(xiàng)目背景
01客戶簡(jiǎn)介
案例客戶是浙江某地級(jí)市的農(nóng)村商業(yè)銀行。
02痛點(diǎn)分析
隨著信息化建設(shè)的不斷推進(jìn),案例客戶數(shù)據(jù)中心的規(guī)模隨之?dāng)U大,帶來的運(yùn)營(yíng)管理難度也在不斷加大,原有的運(yùn)維體系不能滿足當(dāng)前需求,主要表現(xiàn)為:
1. IT設(shè)備規(guī)模大且分散、管理困難,缺少可視化管理系統(tǒng)和可靠的管理手段;
2. IT環(huán)境異構(gòu)、業(yè)務(wù)系統(tǒng)繁多,無法快速適應(yīng)復(fù)雜環(huán)境下設(shè)備的監(jiān)管;
3. 故障定位困難,業(yè)務(wù)系統(tǒng)出現(xiàn)故障波動(dòng)時(shí),根因排查分析緩慢;
4. 業(yè)務(wù)負(fù)載逐年增加,無法確定業(yè)務(wù)系統(tǒng)功能完整可用性;業(yè)務(wù)形態(tài)更加多種多樣,部署環(huán)境愈加復(fù)雜;為了適應(yīng)發(fā)展的需求,業(yè)務(wù)調(diào)整日趨頻繁,現(xiàn)有的監(jiān)控體系無法跟業(yè)務(wù)節(jié)點(diǎn)的擴(kuò)張速度;
5. 技術(shù)的快速演進(jìn),對(duì)運(yùn)維團(tuán)隊(duì)提出了更高的要求。
解決方案
為了提高運(yùn)營(yíng)管理效率,保障業(yè)務(wù)系統(tǒng)穩(wěn)定性,該客戶引進(jìn)了尊龍時(shí)凱智能監(jiān)控平臺(tái)。尊龍時(shí)凱智能監(jiān)控平臺(tái)是集監(jiān)、管、控、服于一體的一站式運(yùn)維監(jiān)控平臺(tái),提供從全棧監(jiān)控、集中告警到資產(chǎn)發(fā)現(xiàn)、數(shù)字化業(yè)務(wù)、故障診斷、可視化、決策輔助等成熟功能,具有如下亮點(diǎn):
項(xiàng)目建成后,尊龍時(shí)凱智能監(jiān)控平臺(tái)實(shí)現(xiàn)了對(duì)該行所有軟硬件IT資源的監(jiān)控納管,包括操作系統(tǒng)、服務(wù)器、數(shù)據(jù)庫(kù)、中間件、網(wǎng)絡(luò)設(shè)備、存儲(chǔ)、探測(cè)、鏈路、虛擬化、云平臺(tái)等,包括先前難以監(jiān)控的信創(chuàng)資源,達(dá)到“一個(gè)平臺(tái)包打天下”的效果,運(yùn)維人員日常工作只需關(guān)注一個(gè)監(jiān)控系統(tǒng)就可以了。
同時(shí),該監(jiān)控平臺(tái)具有非常高效的性能,能夠?qū)Υ笠?guī)模的監(jiān)控節(jié)點(diǎn)實(shí)現(xiàn)秒級(jí)查詢。這就意味著平臺(tái)能夠快速處理大量數(shù)據(jù),即使在高負(fù)載情況下也能保持其性能,即時(shí)響應(yīng)監(jiān)控?cái)?shù)據(jù)的變化,提供最新的系統(tǒng)狀態(tài)信息,提高響應(yīng)速度。
02集中告警
基于統(tǒng)一監(jiān)控的集中告警管理,提供可視化集中告警界面,支持配置不同告警級(jí)別的聲音通知,便于工程師快速聚焦故障信息處理。
具體來說,包括實(shí)時(shí)告警、告警通知(支持告警升級(jí)與告警抑制)、告警分析、告警自愈等核心功能。
實(shí)時(shí)告警:以時(shí)間線條方式展示最新告警,柱狀圖呈現(xiàn)告警變化趨勢(shì),支持聲音提醒、告警彈窗。
告警通知:提供自定義通知規(guī)則,支持短信、郵箱、微信、釘釘、機(jī)器人、腳本等推送方式,支持告警升級(jí)與告警抑制。
告警分析:支持關(guān)聯(lián)拓?fù)?,快速定位故障影響的業(yè)務(wù)范圍;聯(lián)動(dòng)CMDB,獲取故障設(shè)備負(fù)責(zé)人、聯(lián)系電話、所屬機(jī)房、機(jī)柜信息、維護(hù)廠商等信息。
故障自愈:根據(jù)預(yù)設(shè)的規(guī)則,針對(duì)一些常見故障,自動(dòng)觸發(fā)相應(yīng)的腳本,恢復(fù)設(shè)備告警。(如:系統(tǒng)磁盤空間不足告警,自動(dòng)觸發(fā)“磁盤日志文件清除腳本”,恢復(fù)空間使用)
03資產(chǎn)發(fā)現(xiàn)
資產(chǎn)發(fā)現(xiàn)能力能夠?qū)崿F(xiàn)一鍵發(fā)現(xiàn)資產(chǎn)并將其進(jìn)行監(jiān)控納管。具體來說,該行配備了大量的交換機(jī)、路由器、防火墻,甚至是Linux等資產(chǎn),依托資產(chǎn)發(fā)現(xiàn)能力,監(jiān)控平臺(tái)可以自動(dòng)掃描設(shè)備類型,一鍵添加監(jiān)控。它能有效減少手動(dòng)配置工作,提高監(jiān)控系統(tǒng)的納管速度和準(zhǔn)確性,降低管理成本。
04數(shù)字化業(yè)務(wù)
數(shù)字化業(yè)務(wù)是這款運(yùn)維監(jiān)控平臺(tái)區(qū)別于市面上大多數(shù)同類產(chǎn)品的最具特色的功能,其核心是自動(dòng)發(fā)現(xiàn)與生成的業(yè)務(wù)拓?fù)洹?/strong>業(yè)務(wù)拓?fù)淠軌驅(qū)⒅螛I(yè)務(wù)系統(tǒng)的資源及其關(guān)系以可視的拓?fù)鋱D形式映射出來,結(jié)合告警展示,運(yùn)維人員一眼就可以定位故障位置及其影響范圍,節(jié)省寶貴的排障時(shí)間。
圍繞業(yè)務(wù)拓?fù)?,數(shù)字化業(yè)務(wù)還包括業(yè)務(wù)一覽、業(yè)務(wù)資源 、業(yè)務(wù)進(jìn)程、版本追蹤、業(yè)務(wù)容量、業(yè)務(wù)大屏、指標(biāo)分析、業(yè)務(wù)健康度等重點(diǎn)功能。
業(yè)務(wù)一覽主要用于展示業(yè)務(wù)整體概況,包括業(yè)務(wù)總數(shù)、狀態(tài)分析、業(yè)務(wù)排行、健康度分布等,同時(shí)可以配置和優(yōu)先展示重點(diǎn)業(yè)務(wù)系統(tǒng)信息;
業(yè)務(wù)資源以列表形式詳盡展示業(yè)務(wù)拓?fù)渲幸驯O(jiān)控的節(jié)點(diǎn)信息,內(nèi)容較拓?fù)鋱D詳細(xì);
業(yè)務(wù)進(jìn)程用于監(jiān)控監(jiān)控業(yè)務(wù)應(yīng)用進(jìn)程,可查看進(jìn)程名稱、進(jìn)程描述、進(jìn)程路徑以及關(guān)聯(lián)端口等詳細(xì)信息;
版本追蹤可追蹤業(yè)務(wù)拓?fù)涞淖兏^程,支持變更通知提醒;
業(yè)務(wù)容量可查看整體的CPU、內(nèi)存以及文件系統(tǒng)使用率,有助于預(yù)測(cè)和規(guī)劃資源需求,降低了因資源不足,而導(dǎo)致的性能問題和風(fēng)險(xiǎn);
業(yè)務(wù)大屏即業(yè)務(wù)上墻,可直觀展示所有業(yè)務(wù)健康情況,包括業(yè)務(wù)關(guān)系、業(yè)務(wù)告警、業(yè)務(wù)健康度等信息;
指標(biāo)分析支持同一時(shí)間多指標(biāo)聯(lián)動(dòng)分析,可自定義配置關(guān)注的分析指標(biāo);
業(yè)務(wù)健康度則通過智能算法與模型對(duì)業(yè)務(wù)系統(tǒng)健康狀態(tài)進(jìn)行打分,健康度越高意味著系統(tǒng)越健康。
05網(wǎng)絡(luò)拓?fù)?/strong>
以拓?fù)鋱D的形式展現(xiàn)網(wǎng)絡(luò)設(shè)備、服務(wù)器、存儲(chǔ)之間的鏈接關(guān)系,能夠聯(lián)動(dòng)告警信息,幫助運(yùn)維人員及時(shí)了解網(wǎng)絡(luò)問題,提高網(wǎng)絡(luò)運(yùn)行的效率和穩(wěn)定性。網(wǎng)絡(luò)拓?fù)涫侵С肿詣?dòng)發(fā)現(xiàn)并生成網(wǎng)絡(luò)拓?fù)鋱D的。
06知識(shí)庫(kù)
支持知識(shí)檢索與故障知識(shí)自動(dòng)關(guān)聯(lián),便于運(yùn)維人員查找故障解決方案。
07投屏視圖
提供自定義投屏功能,用戶可選取豐富的視圖組件,配置所需的管理視圖。
08報(bào)表系統(tǒng)
提供各類型統(tǒng)計(jì)報(bào)表,如實(shí)時(shí)報(bào)表、TOPN報(bào)表、日?qǐng)?bào)周報(bào)、主機(jī)性能報(bào)表等,為運(yùn)維決策提供支撐;運(yùn)維人員也可根據(jù)需要自定義配置報(bào)表。
客戶收益
項(xiàng)目建成交付后,一站式運(yùn)維監(jiān)控平臺(tái)為客戶帶來如下收益:
提高運(yùn)維效率。基于全棧監(jiān)控實(shí)現(xiàn)對(duì)該行所有的IT資源的統(tǒng)一監(jiān)控納管,結(jié)合集中告警,讓運(yùn)維管理不留死角,運(yùn)維人員得以即時(shí)發(fā)現(xiàn)故障異常并快速響應(yīng),有效提高運(yùn)維效率;
保障業(yè)務(wù)長(zhǎng)期穩(wěn)定。以業(yè)務(wù)為核心的統(tǒng)一運(yùn)維監(jiān)控實(shí)現(xiàn)對(duì)該行關(guān)鍵業(yè)務(wù)流進(jìn)行動(dòng)態(tài)監(jiān)測(cè),確保業(yè)務(wù)運(yùn)行可用性及穩(wěn)定性,可以有效地發(fā)現(xiàn)高風(fēng)險(xiǎn)事件,進(jìn)而降低系統(tǒng)業(yè)務(wù)風(fēng)險(xiǎn),避免經(jīng)濟(jì)損失;
降低管理成本。尊龍時(shí)凱智能運(yùn)維監(jiān)控平臺(tái)的投入使用使該行系統(tǒng)的資源利用率、可靠性、穩(wěn)定性、性能、配置管理的簡(jiǎn)易性和快捷性等都得到了相當(dāng)大的改善,很大程度節(jié)省了其軟硬件基礎(chǔ)設(shè)施和人力資源投入。
尊龍時(shí)凱社區(qū)已經(jīng)開放尊龍時(shí)凱監(jiān)控免費(fèi)版和尊龍時(shí)凱MCM(監(jiān)控+CMDB)免費(fèi)版,歡迎下載使用!
運(yùn)維監(jiān)控的可持續(xù)發(fā)展之尊龍時(shí)凱產(chǎn)品的使用產(chǎn)景和未來規(guī)劃
View details本篇是Zabbix與尊龍時(shí)凱監(jiān)控對(duì)比專題系列文章的第七篇——網(wǎng)絡(luò)功能篇,具體包括IP地址管理、網(wǎng)絡(luò)端口映射發(fā)現(xiàn)、網(wǎng)絡(luò)配置備份、專線監(jiān)控等功能的對(duì)比分析。
View details免費(fèi)版尊龍時(shí)凱智能監(jiān)控平臺(tái)囊括了企業(yè)IT運(yùn)維所需的基本功能,基本可以滿足規(guī)模較小、納管資源數(shù)量較少的企業(yè)的監(jiān)控需求,提高運(yùn)維效率。
View details2020年6月28日,廣州尊龍時(shí)凱獲ISO 27001信息安全管理體系認(rèn)證證書
View details尊龍時(shí)凱CMDB以超低的資源需求與性能消耗完成部署,并實(shí)現(xiàn)對(duì)客戶30萬資產(chǎn)的全面納管。
View details專業(yè)化賦能,尊龍時(shí)凱助力某大型信息技術(shù)企業(yè)數(shù)字化轉(zhuǎn)型升級(jí)
View details尊龍時(shí)凱建立監(jiān)控平臺(tái),做到及早發(fā)現(xiàn)故障、合理利用信息化基礎(chǔ)資源,達(dá)到最大化資源使用,使得醫(yī)院系統(tǒng)信息化建設(shè)健康發(fā)展。
View details尊龍時(shí)凱采用分布式實(shí)施,分別對(duì)主機(jī)、網(wǎng)絡(luò)、存儲(chǔ)、數(shù)據(jù)庫(kù)、中間件、應(yīng)用、硬件和虛擬化等實(shí)施一站式監(jiān)控。
View details