熱門搜索 Zabbix技術資料 Zabbix常見問、答討論 成功案例 Zabbix交流區 Prometheus交流區
深圳市寶安某醫院統一監控平臺項目
該醫院成立于1957年,是集醫療、科研、教學、預防、保健、康復、社區健康服務于一體的國家三級大型公立綜合醫院,是深圳大學和廣東省高等醫學院校教學醫院,廣東醫科大學碩士研究生培養基地和全科醫學專業規培協同基地。
隨著“互聯網+”時代的到來,醫院信息化建設進入關鍵時期。網絡設備、服務器、業務系統、數據庫等軟硬件設備的紛繁復雜以及用戶對IT業務的高可用性需求使得網絡運維工作任務更加艱巨。成立至今,已經建成囊括兩個院區的大型綜合信息系統,包括各類子系統數十個,工作站幾千臺。但是,醫院網絡運維仍然是由醫生、護士在使用過程中發現故障,然后通知信息部門,經過運維人員故障驗證后再開始采取相應措施解決故障。這種被動、孤立的運維方式,使得運維人員疲于處理各種故障、效率低下,即使加班加點地調試、部署、維護,也經常會因設備故障而導致業務中斷,嚴重影響醫院的正常運轉”。
為了對本院網管的各種資源進行綜合管理,更好地監控網絡設備、服務器、業務系統的實時狀態,計劃搭建統一監控平臺,達到提高維護管理效率、降低資源管理的復雜程度,實現故障的快速發現、快速定位;避免、減輕故障對業務、辦公造成的損失。
為了解決醫院龐大的網絡設備數量造成的網絡運維管理困難。基于zabbix為基礎和企業微信的網絡監控系統,通過它實時獲取交換機、服務器等被監控對象的相關數據,掌握網絡、信息系統運行情況,及時發現并解決問題,保證醫院網絡的高可用性。
本項目從硬件、主機、網絡設備、數據庫、中間件、應用、業務系統、存儲、虛擬化的一站式運維管理平臺來實現IT 基礎資源的統一集中管理。
在實際監控架構中,尊龍時凱監控根據網絡環境、監控規模等?分了三種架構:?server-client 、master-node-client、server-proxy-client三種 。
·?server-client架構:
zabbix的最簡單的架構,監控機和被監控機之間不經過任何代理 ,直接由zabbix server和zabbix agentd之間進行數據交互。適用于網絡比較簡單,設備比較少的監控環境 。
·?server-proxy-client架構:
其中proxy是server、client之間溝通的一個橋梁,proxy本身沒有前端,而且其本身并不存放數據,只是將agentd發來的數據暫時存放,而后再提交給server 。該架構經常是和master-node-client架構做比較的架構 ,一般適用于跨機房、跨網絡的中型網絡架構的監控。
·?master-node-client架構:
該架構是zabbix最復雜的監控架構,適用于跨網絡、跨機房、設備較多的大型環境 。每個node同時也是一個server端,node下面可以接proxy,也可以直接接client 。node有自已的配置文件和數據庫,其要做的是將配置信息和監控數據向master同步,master的故障或損壞對node其下架構的完整性。
基于master-node-client架構,按照不同域間可追加多個代理,基本系統要求如下:
角色 | 操作系統 | 磁盤大小 | CPU | 內存 | IP地址 | 主機個數 | 備注 |
采集服務器 | CentOS7 | 50G | 8核 | 8G | 一個IP 地址 | 1 | 守護進程 |
數據庫服務器 | CentOS7 | 500G | 8核 | 16G | 三個IP 地址 | 2 | 主備 |
web服務器 | CentOS7 | 50G | 4核 | 4G | 一個IP 地址 | 1 | ? |
采集代理服務器 | CentOS7 | 100G | 8核 | 8G | 一個IP 地址 | N | 根據主機和網段增加 |
1.?數據庫區域中MySQL1作為主庫,MySQL2作為從庫
2.?采集區域直接對接數據庫區域的主庫MySQL1
3.?WEB區域對于增刪改都直接對接數據庫區域的主庫?MySQL1,讀對接數據庫區域的從庫MySQL2
4.?數據庫區域的主備架構對比主主架構來說優點是技術維護要求較低,不容易出現數據紊亂問題,缺點是當出現主庫異常的時候不會主動啟用備庫,需要手動切換或者等待主庫正常才可以正常采集
5.?采集區域可以對接多臺Proxy代理分擔壓力或分布式監控?
微信作為最大用戶群體的即時通訊軟件,方便快捷,其可用性和持續性已經獲得用戶認可。微信企業號提供了豐富的第三方接口,其官網也提供了詳細的API文檔。監控系統通過調用微信的免費接口,不僅可以實現告警零成本,而且可以及時高效地將告警信息推送給運維人員,以便及時處理。
登錄企業微信管理界面,在“通訊錄”中創建運維管理組,添加成員,在“企業應用”中自建應用。記錄成員賬號,組織部門ID,應用AgentID,CorpID和Secret,監控系統調用API接口時需要用到這些信息。在服務器端,修改微信報警的腳本配置文件中corpid, secret和AgentID值。然后在WEB端,配置報警媒介和觸發微信報警的動作。
配置完成后,當有設備出現故障和恢復的時候, 監控系統自動將告警信息發送至企業微信客戶端。
1.?主機監控:?Centos、Windows
重要指標:針對所有的IOPS
2.網絡設備監控:Cisco、H3C、華為、Juniper
重要指標:針對所有的端口狀態、主板狀態、CPU使用率、內存使用率、溫度等
3.虛擬化監控:VCentor
監控Clusters、Datacenters、Datastores、Hypervisors、VM、vCenter平臺告警對接
Clusters、Datacenters、Datastores、Hypervisors、VM資源相互關聯狀態模塊與監控平臺集成
消息與隊列處理,對接
4.服務器監控:DELL、華為、曙光
需采用IPMI、SNMP、爬蟲等連接查詢數據
重要指標:告警對接、硬盤狀態
5.存儲監控: Netapp、HDS
需采用專門的存儲工具、SMI-S、SNMP、SSH等連接查詢數據
重要指標:告警對接、硬盤狀態、IOPS
通過搭建尊龍時凱監控系統,結合微信企業號,實現告警信息的實時推送,提升了醫院網絡運維的管理效率,保證醫院網絡的高可用性和持續性。系統納管了監控服務器150多個、監控交換機200余個。很好地滿足了中心醫院對網絡環境中的網絡設備、網絡鏈路的實時監控需求。降低了維護人員工作量,提高了工作效率。
尊龍時凱使用開源監控項目zabbix二次開發的尊龍時凱監控系統結合微信推送,實現對網絡運行狀況的有效監測。通過配置不同的觸發策略,根據設備重要程度推送不同級別的告警信息。通過該系統取締了人工的、手工的監控方式,有力的支撐了醫院信息化建設。
加入我們,享受技術樂趣
尊龍時凱監控實現對城建學院復雜網絡環境的直觀、透明式展示和管理,實時、準確了解整個網絡的動態運行情況,給信息部門的決策提供依據。
View details尊龍時凱一站式智能監控+網管平臺,對運維管理流程體系進行重構,提升信息系統監控能力、網絡管理能力以及運維人員工作效率。
View details