數據中心裏有大量電子設備,這些設備並非工業級(工業級的有專門寬溫設計,抗粉塵設計,這類設備往往應用於特殊場合,爲了能夠在這樣惡劣環境中正常工作,這類設備往往會造價很高,很難在數據中心裏大面積推廣)的設計,對運行工作環境有一定要求,尤其是清潔度。如果數據中心裏溼度過於乾燥或者潮溼,各種霧霾、粉塵、有害氣體等充斥在環境中,將對運行的設備造成嚴重傷害,大大縮短設備的使用壽命。所以,保持數據中心內的環境清潔十分必要。不過,數據中心畢竟和普通的場所不同,簡單的打掃衛生難以達到效果,需要制定一套完善的清理衛生制度,並有條不紊地去執行,否則做不好反而帶來更大的損害。本文就來講一講數據中心裏的衛生清掃問題。
首先,數據中心要按照不同區域來制定不同的清理規則。數據中心包括監控管理區、設備機房、配電室、走廊通道、工作輔助區(洗手間、飲水區、會議室)等幾個地方,不同區域要由不同的人員來完成清掃。和其它建築無異,數據中心的建築內也有大廳、電梯、過道、洗手間等公共設施,這些區域基本和設備機房區域是完全隔離的,這裏只要安排一般的清潔人員即可,清潔要求與普通寫字樓建築要求無異,每天按時清掃即可,保持良好的工作環境;然後就是進入設備機房區域,去往設備機房區域一般會有門禁,只有數據中心的技術工作人員才能進入,清潔人員要進入必須經過嚴格審覈,通常在每個月或者每個季度,在數據中心工作人員的陪同下一起進入,然後由清潔人員完成這些區域的衛生打掃,這些地方的清潔度要求要高些。雖然要求高,但由於這裏一般外人很少進入,帶入的塵土並不多,打掃起來並不難;再就是進入設備機房,數據中心內部會劃分很多個設備機房,每個機房都是一個獨立的房間,房間裏常年保持恆溫恆溼的環境,這裏更是少有人員進入,進入的人員也儘量穿戴防靜電服裝和衣帽,減少灰塵的帶入。機房內部衛生清理,一般由數據中心的工作人員來完成,這些人員具備一定的專業技術知識,在進行衛生清理時,避免傷到佈線、出入通風通道、設備,需要有一定的專業技能,普通的清潔工難以勝任這樣的工作;再有就是運行着的設備,無論機房內環境如何清潔,各種灰塵是不可避免會產生的,隨着時間的積累,這些灰塵會越積越多,很多慢慢侵入到設備內部,這時簡單擦拭設備外部都無法達到清潔的目的。對運行的設備進行清潔需要更專業的知識和專用清潔設備。並不是所有設備都可以不斷電進行清潔,需要具體設備採用具體清潔的方法,一般這種清潔只能找原廠的技術人員,由他們完成設備清潔。當然,這個清潔價格也是昂貴的,所以一般不會經常做,往往使用超過一年以上纔會考慮設備清潔。再有,有的設備還必須要斷電才能進行清潔,否則仍會對設備造成損壞,這就需要數據中心進行業務遷移,將設備從環境中隔離出來,再斷電清潔,清潔完畢再放回原有的環境中,將業務切回。數據中心裏的設備成千上萬,要進行一次這樣的清潔是非常浩大的工程,很多數據中心往往將設備放入機房後,直到設備故障或者不再使用,都不曾做過清理,有的數據中心則進入核心的網絡設備進行清理,這樣需要清理的設備數量會非常少,服務器就不管了。
其次,數據中心做清理不能沒有章法,要制定各種詳細的打掃衛生的制度。制度要覆蓋三方面的內容。一是打掃時間和週期,一般普通工作區域每日都要打掃,設備機房區要每個季度打掃,設備要每年進行選擇性地打掃,打掃時間比如可以定位上午10點,打掃完畢確認的簽字表格,確保每個環節都有監督的制度,以便很好地完成清理工作;二是確定打掃的區域,不同的清潔人員負責的區域是不同的,打掃的頻率和方法也不同,爲每個專職和臨時的清潔人員確定到負責的區域;三是清潔標準,並不是打掃完成即可,要有考覈的條件,達到什麼樣的清潔程度纔算打掃完成。比如:地面無任何污漬、窗戶、臺上無灰塵、雜物,空調無灰塵、手印等,交換機,服務器,顯示器、鍵盤、鼠標表面無灰塵,手印,雜物等,各類機房相關物品擺放整齊、無污漬。有了這些標準,對數據中心清潔情況就有了參考數值。四是對清潔人員也要制定詳細的工作管理規定,約束他們,希望他們將工作做好。做到有獎有罰、獎罰分明。
第三,做好出入人員管理。數據中心內部是一個相對封閉的場所,尤其是設備機房幾乎與外界隔離,這樣做的目的是儘量減少外部的灰塵的進入。只要外部放進來的灰塵少了,機房內部的設備很少會自己產生灰塵。在數據中心出入人員的管理上要嚴格,對於進入設備區進行操作的人員和設備要嚴格檢查和審覈。只有這樣,才能徹底消除任何灰塵被帶入機房內部。
俗話說“冰凍三尺非一日之寒”,數據中心內部的清潔環境也要靠一點一滴做起,慢慢累積。如果平日裏不能很好地做好清潔工作,漸漸地數據中心內部各個區域都可能變成垃圾場,污染嚴重,這會對機房裏運行的設備造成不良影響,縮短設備的正常使用壽命。困難的是環境是否衛生不是簡單通過人們肉眼就能看出來的,一旦人們都能看出來就已經污染相當嚴重了,要用專用的空氣環境監測設備來監測,一旦某些指標不符合標準,就要進行及時整改,以便保持清潔的數據中心內部環境。
2018年2月1日 星期四
2017年11月28日 星期二
數據中心網絡帶寬線速有門道
數據中心:線速是體現網絡設備轉發性能的一項重要指標,很多數據中心在採購網絡設備時,都會要求設備具備線速能力,或者是部分線速能力。在RFC 1242中對線速做了定義:在不丟失任何一個幀的情況下最大轉發速率,以太網吞吐量最大理論值稱爲線速,若是千兆設備就要達到千兆的線速,若是萬兆設備就要達到萬兆的線速。理論歸理論,實際中畢竟要考慮很多外界的干擾因素,因此很多時候的網絡都是“僞線速”,線速是要在特定情況下,實驗室環境中才能測試出來的。在選型設備時,不必一味強調滿足各種情況下的線速,實際中除了廣播風暴,也不會設備所有端口都做線速轉發,那一定是一個異常的網絡狀態,一般端口速率超過80%時,數據中心都會開始網絡擴容了,根本不會等到端口線速轉發時纔去擴容。線速是理想化的東西,在選擇設備的時候千萬不要看重這個,否則會被欺騙的。就像我們購買的小汽車,最大行駛速度都可以達到200多公里∕小時,而很多人一輩子都不會將汽車開到那麼高的速度,小汽車設計的理論速度的確可以達到,但會有各種條件限制,所以對網絡設備線速的事兒,且不可鑽牛角尖。下面,就來詳細說一說網絡設備爲滿足線速性能裏的門道。
網絡設備有的只有1 u高,有的卻有20 u高,對外端口有千兆,萬兆,40克、100克甚至更高,尤其是在框式設備上,不同端口速率的板卡插在同一個機框裏,要全部滿足所有板卡都線速,是很難做到的。因爲低速端口板卡內部需要的連接器只要是低速的就可以,而高速端口板卡內存需要高速連接器,在一個機框裏很難全部滿足,或者在某些板卡組合的情況下,部分端口就無法達到線速。這種情況在早期的網絡設備中表現更爲明顯,那時內部連接器速率都比較低,內部還不是信元轉發,按照報文哈希轉發,內部很容易出現擁塞導致業務丟包。在這種情況下,如果數據中心要驗證採購設備的線速性能,往往設備商會將能線速部分展現出來,而小部分無法線速的部分儘量在測試中避免。還有隨着測試報文數量越大(或數據幀越短),網絡設備需要處理和校驗的負擔就會越重,出口轉發速度必然要下降的,但是越接近線性關係。很多網絡設備在大包數據的處理上是可以達到線速的,而報文長度越小,達到線速的難度越大,若報文只有64字節,對設備的性能考驗是最大的。在這種情況下,網絡設備可能達不到線速。其實,我們知道實際的網絡中,是不可能只有一種64字節長度的報文,肯定是各種長度的報文混雜在一起,這時對設備的壓力還不算最大。
線速的概念主要指的是交換機網絡設備,這種設備靠硬件芯片轉發,可以具備線速能力,而這些設備的CPU處理能力是比較弱的,所以CPU處理的報文是遠遠達不到線速的。交換機的CPU不會處理轉發數據報文,除非硬件芯片裏沒有了轉發表項的情況下才會考慮通過CPU轉發,交換機的CPU主要是協議報文的處理和設備管理,處理報文的能力相對很弱,沒有線速的概念,就算是硬件芯片也不是什麼情況下都能滿足所有端口線速,有的芯片受工藝水平所限,芯片整理的轉發帶寬就有瓶頸,當所有外部端口都線速轉發時,芯片就會有丟包,芯片只能保證部分端口線速情況下無丟包。我們知道,在很多選型測試中,經常使用蛇形測試,即將面板所有外部端口都收尾相連,打入線速流量,看是否有丟包,很多設備在這種情況下無法測試通過,就是芯片本身存在端口線速的數量限制。還有路由器,它是靠CPU轉發數據的。路由器雖然CPU能力很強,但是要滿足線速還是很困難,一般路由器會考慮用NP芯片來完成數據轉發,或者也植入硬件芯片來完成,靠硬件的處理速度來滿足線速的轉發,這種設計理念使得路由器和交換機的界限越來越模糊。在很多時候,有人拿路由器當交換機用,有人拿交換機當路由器用,讓兩者技術實現上不斷融合。
線速的測試其實是有標準的,RFC2544就是線速測試的標準.RFC2544明確建議40歲,64128256512年,1024年,1280年和1500年字節這些數據幀是需要測試的。在線速的流量情況下,測試網絡設備的丟包,時延,抖動,吞吐量,背靠背,這些概念在網絡上都可以找到在此不再細說。這裏要注意的是,以太網報文有能看到的部分,也有看不到的部分。在以太網報文之前,還有96位的空閒幀。空閒幀是根據以太網的CSMA / CD原理,用來偵聽鏈路是否空閒,如果空閒,就可以發送報文。接着會有七個字節的前導碼AA(01010101)用於與接收端同步,因爲電平一高一低,很容易同步。最後還有一個字節的AB,作爲幀界定使用,表示後面開始真正的以太幀,這20個字節在日常的網絡抓包中是不可見的,是以太網物理層封裝的東西。這部分長度並不一定是固定的,而是可調的,有的設備爲何提升轉發效率,將這部分調小,這樣單位時間內轉發的報文數量就多,轉發效率提升,不過,這樣做也會帶來困擾,就是與其它設備對接時,其端口轉發速率要比對方高,可能會出現超線速的情況,對其它設備有影響。線速是要求設備提供的幀間隙和前導碼按照標準默認的來,有的網絡設備小包達不到線速時,往往將這部分長度調小,還提升線速能力,這樣就與線速的標準背道而馳。
線速一般是網絡產品在實驗室裏的理論值,是理想化的東西,在實際應用中也要達到線速是比較困難的,所以在選購網絡設備時,不要過於依賴這一性能指標,還是要看網絡設備的綜合處理能力。
網絡設備有的只有1 u高,有的卻有20 u高,對外端口有千兆,萬兆,40克、100克甚至更高,尤其是在框式設備上,不同端口速率的板卡插在同一個機框裏,要全部滿足所有板卡都線速,是很難做到的。因爲低速端口板卡內部需要的連接器只要是低速的就可以,而高速端口板卡內存需要高速連接器,在一個機框裏很難全部滿足,或者在某些板卡組合的情況下,部分端口就無法達到線速。這種情況在早期的網絡設備中表現更爲明顯,那時內部連接器速率都比較低,內部還不是信元轉發,按照報文哈希轉發,內部很容易出現擁塞導致業務丟包。在這種情況下,如果數據中心要驗證採購設備的線速性能,往往設備商會將能線速部分展現出來,而小部分無法線速的部分儘量在測試中避免。還有隨着測試報文數量越大(或數據幀越短),網絡設備需要處理和校驗的負擔就會越重,出口轉發速度必然要下降的,但是越接近線性關係。很多網絡設備在大包數據的處理上是可以達到線速的,而報文長度越小,達到線速的難度越大,若報文只有64字節,對設備的性能考驗是最大的。在這種情況下,網絡設備可能達不到線速。其實,我們知道實際的網絡中,是不可能只有一種64字節長度的報文,肯定是各種長度的報文混雜在一起,這時對設備的壓力還不算最大。
線速的概念主要指的是交換機網絡設備,這種設備靠硬件芯片轉發,可以具備線速能力,而這些設備的CPU處理能力是比較弱的,所以CPU處理的報文是遠遠達不到線速的。交換機的CPU不會處理轉發數據報文,除非硬件芯片裏沒有了轉發表項的情況下才會考慮通過CPU轉發,交換機的CPU主要是協議報文的處理和設備管理,處理報文的能力相對很弱,沒有線速的概念,就算是硬件芯片也不是什麼情況下都能滿足所有端口線速,有的芯片受工藝水平所限,芯片整理的轉發帶寬就有瓶頸,當所有外部端口都線速轉發時,芯片就會有丟包,芯片只能保證部分端口線速情況下無丟包。我們知道,在很多選型測試中,經常使用蛇形測試,即將面板所有外部端口都收尾相連,打入線速流量,看是否有丟包,很多設備在這種情況下無法測試通過,就是芯片本身存在端口線速的數量限制。還有路由器,它是靠CPU轉發數據的。路由器雖然CPU能力很強,但是要滿足線速還是很困難,一般路由器會考慮用NP芯片來完成數據轉發,或者也植入硬件芯片來完成,靠硬件的處理速度來滿足線速的轉發,這種設計理念使得路由器和交換機的界限越來越模糊。在很多時候,有人拿路由器當交換機用,有人拿交換機當路由器用,讓兩者技術實現上不斷融合。
線速的測試其實是有標準的,RFC2544就是線速測試的標準.RFC2544明確建議40歲,64128256512年,1024年,1280年和1500年字節這些數據幀是需要測試的。在線速的流量情況下,測試網絡設備的丟包,時延,抖動,吞吐量,背靠背,這些概念在網絡上都可以找到在此不再細說。這裏要注意的是,以太網報文有能看到的部分,也有看不到的部分。在以太網報文之前,還有96位的空閒幀。空閒幀是根據以太網的CSMA / CD原理,用來偵聽鏈路是否空閒,如果空閒,就可以發送報文。接着會有七個字節的前導碼AA(01010101)用於與接收端同步,因爲電平一高一低,很容易同步。最後還有一個字節的AB,作爲幀界定使用,表示後面開始真正的以太幀,這20個字節在日常的網絡抓包中是不可見的,是以太網物理層封裝的東西。這部分長度並不一定是固定的,而是可調的,有的設備爲何提升轉發效率,將這部分調小,這樣單位時間內轉發的報文數量就多,轉發效率提升,不過,這樣做也會帶來困擾,就是與其它設備對接時,其端口轉發速率要比對方高,可能會出現超線速的情況,對其它設備有影響。線速是要求設備提供的幀間隙和前導碼按照標準默認的來,有的網絡設備小包達不到線速時,往往將這部分長度調小,還提升線速能力,這樣就與線速的標準背道而馳。
線速一般是網絡產品在實驗室裏的理論值,是理想化的東西,在實際應用中也要達到線速是比較困難的,所以在選購網絡設備時,不要過於依賴這一性能指標,還是要看網絡設備的綜合處理能力。
訂閱:
意見 (Atom)

