機房建置,隨着互聯網服務需求的日益增長,以及社交媒體的蓬勃發展,不斷被收集的“大數據”已然給現今的數據中心帶來了越來越大的業務壓力。整個數據中心行業都必須確保不斷升級爲更高的帶寬和更高的存儲容量功能,以保證不間斷的服務和成本控制。
各大主要的互聯網企業,包括谷歌和亞馬遜都已經研發和設計了他們自己的數據中心設備。他們開發了定製化的網絡和軟件解決方案,以滿足他們特定的業務需求。其他企業包括Netflix和Shutterfly則採用了不同的方法,他們採用了半定製化的存儲硬件。由於存儲和帶寬的需求加速,這些“超大規模”的數據中心均走在了數據中心業界採用不同的商業模式的前沿。這些變化包括以非傳統的方式與新的企業合作,以滿足他們升級大型機架式系統所涉及的複雜的管理和後勤工作的需求。超大規模並不一定意味着非常大的數據中心,但其架構卻能夠實現規模的快速縮放,或在不改變硬件和網絡基礎設施的前提下的擴展。
較之設計和構建一處新的數據中心而言,擴展現有的數據中心基礎設施是一項不同的挑戰。對現有數據中心的擴展必須是在保證其24/7全天候正常運營的前提下,硬件的擴展需要無縫發生,而不中斷業務。爲了處理增加容量的挑戰,一些更先進的數據中心的架構是基於一種“組合式”的方法。其優點是能夠按比例,實時進行規模化擴展,而不改變存儲或存儲服務器的元素。使用這種方法,擴大現有基礎設施的帶寬或存儲容量更多的是由數據中心的運營業務,供應鏈,測試工程和後勤挑戰,而非設計或架構決策而推動的。然而,正如下文的案例中所介紹的情況那樣,實時增加數據中心的容量具有其自身的複雜問題,需要高度的運算精度來維持現有基礎設施的24/7全天候不間斷運營。
案例:升級數據中心容量
升級一家公司的數據中心容量需要大型機架系統的無縫安裝,確保24/7全天候不間斷的正常運行。附加的硬件不能是新的或定製化的設計。在該案例中,其擴展項目將基於數據中心現有的硬件,藉助該公司自己擁有和經營的數據中心所開發的軟件圖像。這家企業選擇的一家更爲傳統的合作伙伴是一家電子合約製造商。該合約製造商新美亞公司(Sanmina),在存儲和存儲服務器整合以及系統設計方面具備相當的經驗。而該數據中心運營商部分的受益是顯著的成本節約,以及獲得一家大型合約製造商遍佈歐洲和亞洲的設施。
該系統的建立和安裝,必須以確保該公司現有數據中心基礎設施的持續運作爲前提,往往在一個短的安裝窗口。該公司每季度都需要增加幾百臺新的數據中心機架。該項目需要精確和有效的規劃,以及每季度對其完美的執行。
這項計劃主要是按如下四大步驟執行的:
開發一款模塊和高度可擴展的測試系統
實施有效的製造流程
創建自定義的供應鏈管理流程
設計一個靈活的物流系統
模塊化和高度可擴展的測試系統
在數據中心基礎設施中,開發一款模塊化和高度可擴展的測試系統,大量的機架可以並行測試是必不可少的。這是可能的,因爲該合約製造商擁有大型的生產設施,且具有廣泛的測試專業知識。定製化軟件圖像生成和Nagios管理軟件可用來實現自動化的流程。此外,通過與該數據中心企業的一致溝通,提供實時的測試狀態,提高了產品的部署。其結果是實現了更快的項目啓動,且測試過程的可信度較高。
高效的製造工藝
新美亞公司充分利用了其在複雜計算和通信硬件方面的BTO/CTO(構建和配置命令)方面的經驗,優化了機架系統季度生產緊密的日程安排。設計出一套高效的電源和空調系統,以適應72臺機架同時供電的峯值要求。這種方法使所有機架能夠並行測試,降低了整個系統的測試時間。在系統中針對每臺機架進行配置和安置的過程中進行開發。其指定了相關機架在數據中心的確切位置,並啓用了高效和及時的安裝。此外,供應商在生產和測試的集成設施的過程中也一直在現場,以確保故障組件能夠立即更換。
定製化的供應鏈管理流程
想要在短時間內實施組裝,測試和交付的管理,必須實施一套定製化的供應鏈解決方案。這包括跨三個不同的時間區域採用靈活的工具來管理項目。實施組件交付的詳細跟蹤,以保證按時到貨。每日供應鏈狀態更新監測,以確定潛在的交付問題。預測更換零件的有效方法,使他們能夠在新版本發佈的第一時間作爲組件進行購買。這種方法適應很短的服務器組件的生命週期,消除了部分組件變得過時的風險,並儘量減少潛在的多餘材料。
靈活的物流系統
物流系統是專門爲這家數據中心客戶設計的。其包括在一年中的不同季節時期,甚至極端氣候條件下確保運輸系統的能力。通過精心挑選貨運商,以確保空氣懸掛減震系統和溼度控制。這樣做對於消除由於極端溫度和溼度所造成的故障危險是必要的。每個箱子均進行了詳細的標識。這個過程有助於順利在四小時內將特定機架安置到數據中心指定交付的樓層位置。嚴格四小時的限制是爲了保證數據中心冗餘系統的不間斷服務。可重複使用的機架包裝設計和測試爲機架提供強有力的保護。此包裝設計也有助於非常高效的遞送,同時消除了針對特殊的設備和工具拆包,和在數據中心裝卸卸載系統的需要。
通過設施的開發,流程和工具的配置和測試,72臺系統實現了並行運行,新美亞公司每個季度都能夠在兩個星期內提供200個系統。最重要的是,該數據中心企業降低了故障率,並優化了整個系統的成本。擴大了機架系統的測試覆蓋率,在全面的舊設備淘汰過程中,顯著降低了設備的早期故障,消除所有的故障事件,降低了總成本。
以上均是數據中心擴展采用一種新的業務模式所帶來的好處。尤其重要的是由這家合約製造商所帶來的腳本測試、系統測試開發和物流方面的經驗。該合約製造商的專業知識及遍佈全球的設備,使得這家數據中心企業實現了全新的商業模式,並大大降低了成本。而隨着IT產業的成熟和發展,這個模型有可能被證明針對其他高速增長的數據中心和雲計算的部署亦是非常有效的。
沒有留言:
張貼留言