2018年3月13日 星期二

機房建置網絡交換設備架構之戰

機房建置,交換技術是網絡中的重要技術之一,尤其是在數據中心裏二三層的網絡中,應用極其普遍。交換機是交換技術的典型產物,在數據中心裏到處都是,是搭建數據中心局域網的必選設備。
 機房建置
交換技術是網絡中的重要技術之一,尤其是在數據中心裏二三層的網絡中,應用極其普遍。交換機是交換技術的典型產物,在數據中心裏到處都是,是搭建數據中心局域網的必選設備。交換機分爲盒式交換機和框式交換機,最大的區別是盒式交換機一般只有1~2U高,只有一塊交換芯片或者只有幾塊交換芯片自己互聯,不需要橋接芯片,而框式交換機因爲有多塊插卡,每個插卡都是1U高,這樣插卡之間就需要橋接芯片來完成插卡之間的數據轉發。框式交換機在數據中心網絡匯聚和核心的位置,處理着海量數據的轉發。框式交換機將交換技術發揚光大,尤其是在插卡之間的數據交換處理上,不斷做出各種各樣的設計,以便在交換容量、降低設計成本等方面不斷提升。單從交換架構方面來說,當前存在兩種最爲主要的交換架構:一種是傳統的基於報文選路轉發的交換;另一種是新興的基於信元轉發的交換,兩種架構各有優缺點,引爆了交換架構選擇之戰。
基於報文選路轉發交換
這種方式從有框式交換機以來就存在,通過橋接芯片將多個插卡連接起來,橋接芯片的數量直接決定了插卡之間的轉發帶寬,最開始很多設備將橋接芯片放在了一塊集中插卡上,發現受限於橋接芯片的轉發能力,根本無法滿足多塊插卡之間的流量線速轉發,隨着框式設備的槽位設計的越來越多,插卡線速轉發能力越來越低。於是有人開始設計多插卡方式,用包含有多塊橋接芯片的查看來實現插卡連接,每塊橋接插卡都會爲交換插卡提供一部分帶寬,多塊橋接插卡一起工作就可以爲每塊交換插卡提供很大帶寬,實現每個插卡都可以線速轉發,這種實現方式一度在數據中心網絡中盛行十年之久,幾乎所有的框式設備都是基於這樣的架構實現。不過,隨着數據中心流量的不斷增長,插卡上的所有端口都被用上,就發現在一些特殊流量場景中,這些插卡出現了無法線速的情況,這與理論測試不符。其實出現這種情況和這種架構有關,一個插卡上來的流量要基於報文特徵來選路,將報文送到不同的橋接插卡上,在橋接插卡上實現流量的負載分擔,因爲單塊的橋接插卡無法滿足框式交換機所有交換插卡的線速需求,由於進入插卡的報文特徵變化並不是完全均勻的,從而選路到不同橋接插卡的流量也不會是完全均勻的,如果橋接插卡設計的帶寬冗餘很小甚至沒有的話,一點點的不均勻都會造成擁塞,從而出現丟包,交換插卡無法達到線速轉發,這種情況在實際網絡中並非少見,一旦碰到只能調整選路算法(未必有用),或者換帶寬容量更大的設備,儘可能多地留出一些冗餘帶寬來。
基於信元轉發交換
正因爲報文選路轉發交換架構具有天生的缺陷,基於信元方式轉發架構誕生。這種方式也需要多塊橋接插卡,交換插卡具備了一種分片能力,它可以將進來的報文,分解成多個大小相同的信元,然後分別發向不同的橋接插卡,這樣發給每個橋接插卡的報文大小都是相同的,去往不同橋接插卡的流量就永遠都是均勻的,就不會存在選路不均的問題。這種方式徹底解決了以往交換架構內部流量不均,擁塞的問題,成爲新的主流交換架構。不過,基於信元轉發也有其技術固有缺陷。交換插卡將每個報文都要做分片(一般是按照固定的64字節或者128字節分片,最後一片字節不夠也要補齊到64或者128字節),經過橋接插卡轉發後,還要在出口插卡上重組,還原出來經過轉發後的完整報文,而基於報文選路方式就不需要,這無疑增加了設備的轉發開銷,所以這種架構相比基於報文選路,轉發效率要低,轉發時延要高,因爲很多報文分片後最後一片都要添加空的數據補齊,每個信元也要有自己的轉發頭,這些數據都要多佔用一些數據帶寬,浪費掉了部分內部帶寬。這種方式還會增加故障概率,只要有一塊橋接插卡出了問題,整個設備的轉發都會受到影響,因爲幾乎每個報文的信元都要經過這塊橋接插卡,基於報文選路轉發則不會,哪塊橋接插卡出問題,影響的只是HASH選路到這塊橋接插卡的業務,走到其它橋接插卡上的業務不受影響。還有一旦報文進入交換插卡,到橋接插卡都是信元轉發,極不利於問題定位,這時在橋接插卡上根本看不到報文內容,發給每個橋接插卡的報文長度特徵都一樣,到底是交換插卡出了問題,還是橋接插卡出了問題,區分不清,往往要通過替換測試才能明確。基於報文選路的架構就很容易,根據報文特徵在內部端口上做統計,確認問題發生的位置,可以很快找到問題原因,方便維護,這樣也使得不少人又轉頭追逐基於報文的選路交換架構。
經過以上的介紹,兩種交換架構各有優缺點,誰也無法替代誰。兩種架構技術目前都較爲成熟,具備實際應用的水平,設計成本差別也不大。具體在數據中心裏使用哪種交換架構設備(一臺設備無法同時具備兩種架構),還是要從實用角度來考慮,要看數據中心更看重哪個方面。如果數據中心裏的流量不夠大,報文特徵也比較單一,變化比較均勻,就可以考慮方便維護的基於報文選路的交換設備;如果數據中心的流量超大,交換插卡的端口基本全要用上,並且帶寬利用率很高,建議選用基於信元轉發的交換設備,避免出現無法達到線速的問題,兩種交換架構將在未來的一段時間裏長期存在,供數據中心選擇。

沒有留言:

張貼留言