數據中心環境監控系統是一個軟件和硬件結合的複雜性系統,本文將對監控管理系統的核心軟件模塊的組成、技術、應用場景等進行詳細介紹,爲系統設計提供必要的參考。
監控管理系統由四大系統組成:監控系統,運行管理系統,總控中心繫統和基礎服務系統組成。
以下分別對四大系統中的核心模塊進行詳細介紹。
一、監控系統
監控系統由兩大子系統組成:信息採集子系統和信息處理子系統。
1、信息採集子系統
爲實現模塊化設計,分佈式部署,提高監控管理系統穩定性,信息採集子系統基本已經硬件化,即由一個硬件設備或者硬件模塊,代替了傳統的用純軟件方式來實現信息採集功能。
採集模塊主要功能一是提供各種形式的接口,以便接入各種不同的監控管理對象;
二是實現各種採集信息的協議解析;
三是將解析後的信息按統一格式上傳至處理單元。
2、信息處理子系統
信息處理子系統是監控管理系統中完成監控功能的核心子系統,要實時、靈活、準確地加工、運算、存儲大規模數據,需要設計好幾個關鍵模塊:複雜事件分析處理模塊、調節控制模塊。
(1)複雜事件分析處理模塊
複雜事件分析處理模塊(CEP,Complex Event Processing)先捕獲各種基礎事件,然後分析整理,找出更有意義的事件(複合事件)。
其中事件的分析整理,找出複合事件,正是CEP的核心,也是最困難的地方。
複雜事件分析處理模塊工作原理如圖1,實時數據作爲事件源接入事件處理總線,CEP引擎通過指定的規則,處理這些實時數據和緩存的歷史數據,並通過事件處理總線將有意義的事件提供給事件消費方。
一個典型的應用實例是,在數據中心停電時,會引發大量的設備報警,通過複雜事件分析處理模塊進行分析後,則可從事件潮中分析出真正的告警原因,將所有設備報警合併成一條停電報警。
複雜事件分析處理模塊需要處理海里事件,處理壓力大。
複雜事件分析處理技術不同於傳統的數據庫數據處理,由實時產生的數據流驅動事件處理邏輯,在內存中完成所有計算,性能有數量級提升,能滿足實時處理要求。
複雜事件分析處理模塊的事件匹配規則是提高處理的有效性的關鍵,使用中,當監控對象的邏輯關係發生改變時,必須維護事件匹配規則,以保證處理的正確性。
(2)調節與控制模塊
總控中心繫統對於影響到用戶業務系統安全的設備都是採取的只監視不控制的原則,對於非核心業務和系統,如環境監測設備(如:新風機、燈光照明)、安防系統(如:閉路視屏監控系統、門禁考勤系統)等是可以接收控制輸入的,可以利用這一特性,通過調節與控制模塊對數據中心進行精細化、智能管理。
調節與控制模塊工作方式有兩種:一種是手動調節與控制,一種是自動調節與控制。
手動調節與控制相對比較簡單,由人來進行判斷、決策,形成控制指令,通過監控系統下發到對應的設備,達到調節和控制的目的。
此時,系統的調節和控制完全依賴個人經驗,隨機性比較強。
常見的手動調節與控制方式有遠程開門,根據機房溫度,手動調節每個空調的設定溫度等。
手動調節和控制不僅通過監控系統來完成,也可以通過電話、短信等方式進行操作,如可以通過電話開門、短信查詢關鍵設備狀態等。
自動調節與控制區別於手動的地方在於,將人的經驗數據內置到了監控系統中。
監控系統根據這些經驗數據,形成調節與控制邏輯。
當監控系統採集到的數據流入該調節與控制邏輯單元時,該單元形成預期的調節與控制指令,下發到對應的設備,從而實現了無人值守的自我調節。
該技術最常見的一種應用是聯動控制,如消防火災聯動門禁開門、門禁開門聯動視頻錄像、消防火災聯動實時視頻播放等。
隨着綠色數據中心的發展,該技術也逐漸應用到數據中心的節能領域,如空調羣控技術就是這種思想應用的一種實例。
沒有留言:
張貼留言