2017年11月30日 星期四

機房建置如何減少人爲故障發生率

機房建置企業常常因爲運維管理人員的操作不當問題而出現硬件和網絡故障等問題。
那麼不管是在機房還是遠程運維的工作人員選擇何種日常事務處理方式來高效安全工作?
 機房建置
(1)明確穩健的流程和文檔
在數據中心進行的操作過程都應該文檔化,有着明確具體的驗證和實踐過得程序來進行。
當然在開始的時候需要數據中心管理人員花費時間和精力來創建、記錄與維護這些流程和程序,建立程序庫並對工作員工進行培訓和學習,可以有效避免因爲操作不當引起的網絡問題。
(2)上崗前進行專業知識培訓
數據中心工作人員應該瞭解電氣和機械系統的基本知識,數據中心繫統之間的相互關係,以及如何解決在這些類型的環境中可能出現的常見問題。
此外,工作人員還應具有良好的解釋能力和分析解決問題的能力。
爲了建立一致的基礎知識,服務供應商也應該定期培訓他們的員工。
McClary指出,許多數據中心設施運營商只提供短暫的工作培訓,但不一定會長期進行。
培訓必須持續開展,而每個員工都應該對自己的教育和能力負責。
記錄的流程和程序可爲培訓工作奠定基礎。
隨着知識範圍的不斷變化和擴展,額外的培訓可以確保對每個工作人員的角色,責任,以及所需技能有着敏銳的瞭解。
(3)日常檢查和演練
數據中心員工花費時間去體驗並檢查數據中心設施中的所有關鍵系統至關重要。
這些演練可以與培訓工作結合起來,幫助工作人員認識到關鍵組成部分和任何可能出現的問題。
數據中心管理人員應該通過他們的檢查來制定一些文檔化的程序來幫助指導這些工作。
這包括在演練期間應該檢查的項目的列表,工作人員應該記錄的具體參數,以及在參數結果中應採取的步驟。
通過演練可以幫助工作人員找出容易糾正的問題,防止以後出現更大的問題。
數據中心在進行租機服務時,通過手動操作來機房佈線、上架服務器、安裝系統、分配IP、添加硬盤等,不可避免的出現一些誤操作,用戶在遇到這類問題時可以督促運維工作人員仔細,同時也可以適當的理解這種錯誤的出現。
現在比較先進的鏡像和備份功能,對於數據丟失問題有一定的解決作用。
總而言之,在完美的設備沒有完美的管理措施是容易發生事故的。
數據中心的所有管理人員只有熟悉自己是誰,自己要做什麼才能真正確保數據中心安全的運轉。

沒有留言:

張貼留言