2018年1月29日 星期一

機房建置,提升性能的小建議

機房建置,不是所有的IT設施建設項目都需要大量的預算和長期的計劃。下面這些相對便宜的升級建議能提高性能和可靠性。
 機房建置
IT主管總是想平衡數據中心的性能和效率,但時間和金錢是制約這兩者的因素。並不是每一個IT項目都要花費大量金錢和時間去進行的,一些快速簡單的升級能使數據中心的性能有明顯的效果,甚至可以作爲新員工培訓的起點。
一、升級服務器硬件
內存或本地磁盤升級可以使得服務器更快和容易地提升性能或容量增加。
內存是虛擬化環境中的一種受限資源。服務器很少有完整插滿整個主板的內存槽。在未使用的插槽添加內存可以改善現有虛擬機的資源緊張現狀並適應未來的虛擬化服務器的發展。
固態硬盤(SSD)是一種前瞻性的服務器本地磁盤升級。固態硬盤極大地提高磁盤I / O和擁有更低的延遲。固態硬盤可以加速性能,如果一個服務器的工作負載主要依靠磁盤緩存,並不需要更換所有的磁盤,更好的做法是添加一些SSD在服務器的本地存儲以消除性能瓶頸。
服務器固件升級是及時和免費的,但並不是所有的更新都需要升級。只有當補丁是解決你服務器某些硬件具體問題的時候才需要升級,並且要考慮操作系統的支持。檢查資產管理庫存列表中當前服務器的型號和固件版本,然後檢查服務器廠商的網站並下載更新。在更新之前,檢查升級的更新日誌,確認更新解決了什麼問題。一些外圍設備或適配器也有可能需要更新固件。
除非支持熱插拔,內存和磁盤將會有系統停機和重啓的因素。所以升級內存和磁盤最好在計劃的服務器停機時間進行升級。
升級磁盤來提高容量的花費可能不少,所以儘量把磁盤裏不必要的內容定時刪除,並把使用率較低的數據轉移到低階的儲存是一個很好的辦法。例如,臨時目錄與不需要的數據,通過清除/tmp(linux)和C:\windows\temp(windows)來節省磁盤空間。
二、優化線纜
隨着網絡帶寬開始普及10G以太網(GigE),甚至25GbigE。原有基於1GigE帶寬的CAT5和5E銅線已經無法滿足新的數據中心需求。
在一些情況下,IT管理人員往往只注意高帶寬的網絡硬件,但佈線卻沒有隨着升級。
升級並不需要一次性換下所有老化的線纜,因爲以太網布線是完全向後兼容的。在時間和金錢等條件的制約下,相對小量的更換可以換來更高的效率。在服務器上,10GigE網絡在未來都將仍是主流,所以我們要把重點放在骨幹網絡上,特別是以太網以太網的iSCSI和光纖通道存儲。例如,CAT 6電纜可以在55米距離支持10GigE的以太網,而CAT 6A和CAT 7電纜可以支持到100米,而這些升級並不需要新的網絡適配器,交換機或其他部件。
超過40GigE帶寬的長距離傳輸需要昂貴的光纖管道及專業技能部署和整合,這需要作爲一個正式項目的投資評估。
要區分新老雙絞線電纜最好通過彩色膠套或另外的標籤來區分,必須清楚地標記線纜或標籤接線板。
三、增加各種監控設施
數據中心的基礎設施管理(DCIM)工具用於監控各種設施的電氣性能和環境溫度等等。
DCIM需要大量傳感器放置在數據中心。這些工具可能會觸發預定的容災事件自動響應,如服務器過熱發出警報,水冷設備迴路泄漏。所以應該填補缺少的傳感器。
從下面列舉的傳感器,你可以看看缺少了什麼?
•機櫃/機架溫度監控傳感器
•用於監控空氣乾燥/冷凝水平的傳感器
•水冷設備所需的水分(液體)傳感器
•店裏試試監控和跟蹤的傳感器
•確保風扇和過濾器正常運行的空氣流量傳感器
•用於動態監控、發現非法進入者會發出警報的傳感器和監控設備
•防止火災的煙霧傳感器
•硬件設施可使用電子標籤作爲資產登記
在數據中心的費用預算裏,監控往往是最後增加的預算而被縮減,所以數據中心的傳感器和監控很有改進的餘地。
新型傳感器可以進行快速、無損的安裝,讓增量成本保持最小和時間效率變得更高。
四、提高數據安全性
操作系統和應用程序的安全更新對於管理員來說已經不陌生,但有時候這種低級重複性的任務會使得數據中心的其他任務因此而延期,如日常消防和其他更復雜的項目。
定時檢查每個服務器系統的漏洞報告和最新補丁,假如有自動化工具就更簡單,如WSUS服務器可以對整個網絡裏的Windows服務器進行自動補丁推送。
虛擬化平臺底層的更新,例如當虛擬機遷移到VMware vSphere 6可能會因爲測試而延遲。這時需要檢查硬件和軟件虛擬化服務器,以驗證他們是否支持新的需求,並完成測試環境的測試,這樣才能無縫遷移到生產環境。另一種簡單的方法是更新虛擬機服務器的VMware工具至當前的ESXi版本。
還有一些其他的安全增強功能:檢查並修復文件權限,重置Active Directory老用戶或不準確的記錄等。這些動作對正在運行的服務構成的風險很小。
五、檢查和改進流程
現代的數據中心通過概念推動進程。執行策略和程序以減少誤差,無論是誰執行工作都可以保持結果的一致性。隨着越來越多的IT部門開始使用基於腳本的自動化工具(如PowerShell)來處理複雜的工作流,工作流程的實際步驟會變得容易被遺忘。
進行消防演練來驗證現有基礎設施的容災。這時災難恢復(DR)和可恢復系統尤爲重要,如服務器集羣系統。測試服務器故障轉移集羣的功能可以在主備服務器之間進行測試切換。
在數據中心,週末進行定期維護可能是一個很好的時間段,可以用來測試備用數據的正常,因爲在日常的工作時間,許多數據中心不允許有中斷時間。在故障來臨之前將容災測試工作做好是非常重要的。

沒有留言:

張貼留言