1. 程式人生 > >[轉帖]今天我們來聊聊機框式核心交換機硬體架構演進

[轉帖]今天我們來聊聊機框式核心交換機硬體架構演進

今天我們來聊聊機框式核心交換機硬體架構演進

2018-12-17 14:46 出處:其他 作者:佚名   

  【PConline 乾貨鋪】隨著網際網路業務的高速發展,對構建網際網路基礎架構的網路裝置提出了更高要求,例如容量、效能、擴充套件性以及QoS等諸多關鍵特性,而這往往是由其所採用的硬體架構決定的。

  我們以框式核心交換機為例,先後出現了多種硬體架構,而現在最為常用的有三種:Full-Mesh交換架構、Crossbar矩陣交換架構和基於Cell的CLOS交換架構。本文將通過對這三種硬體架構、報文轉發流程等原理的分析,全面剖析三種架構的優劣勢。

  名詞解釋

  Full-Mesh
  架構說明

  如上圖所示,所有業務線卡通過背板走線連線到其它線卡,因為Full-Mesh不需要外部的交換晶片,而是任意兩個節點間都有直接連線,故得名全連線。

  由於各線卡需要Full-Mesh互聯,一個節點數為N的Full-Mesh,連線總數為【N×(N-1)】÷2,所以隨著節點數量增加連線總數也急劇上升,因而可擴充套件性較差,僅適用於槽位數量較少的核心裝置。

  報文轉發流程

  1.報文從線卡進入,跨卡報文送到與目的線卡連線的背板通路;

  2.報文到達目的線卡。

  Crossbar
  架構說明

  如上圖所示,業務線卡通過背板走線連線到Crossbar晶片上,Crossbar晶片整合在主控引擎上。

  Crossbar晶片架構圖所示,每一條輸入鏈路和輸出鏈路都有一個CrossPoint,在CrossPoint處有一個半導體開關連線輸入線路和輸出線路,當來自某個埠的輸入線路需要交換到另一個埠的輸出點時,在CPU或交換矩陣的控制下,將交叉點的開關連線,資料就被髮到另一個介面。

  簡單地說,Crossbar 架構是一種兩級架構,它是一個開關矩陣,每一個CrossPoint都是一個開關,交換機通過控制開關來完成輸入到特定輸出的轉發。如果交換具有N個輸入和N個輸出,那麼該Crossbar Switch就是一個帶有N*(N-1)≈N²個CrossPoint點的矩陣,可見,隨著埠數量的增加,交叉點開關的數量呈幾何級數增長。對於Crossbar晶片的電路整合水平、矩陣控制開關的製造難度、製造成本都會呈幾何級數增長。所以,採用一塊Crossbar交換背板的交換機,所能連線的埠數量也是有限的。

  報文轉發流程
  無快取Crossbar 

  每個交叉點沒有快取,業務排程採用集中排程的方式,對輸入輸出進行統一排程,報文轉發流程如下:

  1.報文從線卡進入,線卡先向Arbiter請求傳送;

  2.Arbiter根據輸出埠佇列擁塞情況,決定是否允許線卡傳送報文到輸出埠;

  3.報文通過Crossbar轉發到目的線卡輸出埠。

  由於是集中排程,所以仲裁器的排程演算法複雜度很高,擴充套件性較差,系統容量大時仲裁器容易形成瓶頸,難以做到精確排程。

  快取式Crossbar

  最早的快取式Crossbar只有交叉節點帶快取,而輸入端是無快取的,被稱為”bus matrix”,後來,CICQ的概念被引入,即在輸入端用大的Input Buffer,在中間節點用小的CrossPoint Buffer。

  這種結構採用分散式排程的方式進行業務排程,即輸入和輸出端都有各自的排程器,報文轉發流程如下:

  1.報文從線卡進入,輸入埠通過特定的排程演算法(如RR演算法)獨立地選擇有效的VOQ;

  2.將VOQ佇列頭部分組傳送到相應的交叉點快取;

  3.輸出埠通過特定的演算法在非空的交叉點快取中選擇進行服務。

  由於輸入和輸出的排程策略相互獨立,所以很難保證交換系統在每個時隙整體上達到最佳匹配狀態,並且排程演算法複雜度和交換系統規模有關,限制了其擴充套件性。

  CLOS
  架構說明

  如上圖所示,每塊業務線卡和所有交換網板相連,交換晶片整合在交換網板上,實現了交換網板和主控引擎硬體分離。CLOS架構是一種多級架構,每個入口級開關和每個中間級開關之間只有一個連線,並且,每個中間級開關正好連線到每個出口級開關,這種架構的優點是可以通過多個小型Crossbar 開關來實現大量輸入和輸出埠之間的連線,CrossPoint數量級別低於Crossbar架構的N的2次方,降低了晶片實現難度。

  報文轉發流程
  基於Cell的動態負載

  1.入方向線卡將資料包切分為N個cell,其中:N=下一跳可用線路數量;

  2.交換網板採用動態路由方式,即根據下一級各鏈路的實際可用交換能力,動態選路和負載均衡,通過多條路徑將分片傳送到出方向線卡;

  3.出方向線卡重組報文。

  動態負載關鍵點在於能負載分擔地均衡利用所有可達路徑,由此實現了無阻塞交換。

  CLOS架構交換機的分類
  非正交背板設計

  如上圖所示,業務線卡與交換網板互相平行,板卡之間通過背板走線連線。

  背板走線會帶來訊號干擾,背板設計也限制了頻寬的升級,同時,背板上PCB的走線要求很高,從背板開孔就成了奢望,這直接導致純前後的直通風道設計瓶頸一直無法突破。

  正交背板設計

  正如上圖所示,交換機線卡與交換網板分別與背板對接。

  同非正交背板設計一樣,背板頻寬限制了頻寬的升級,同時也增加了散熱的難度。

  正交零背板設計

  上圖中,業務線卡與交換網板互相垂直,背板走線為零,甚至無中板。

  正交設計能減少背板走線帶來的高速訊號衰減,提高了硬體的可靠性,無背板設計能夠解除背板對容量提升的限制,當需要更大頻寬的時候,只需要更換相應板卡即可,大大縮短業務升級週期,並且因為沒有了背板的限制,交換機直通風道散熱問題迎刃而解,完美匹配資料中心機房空氣流的走向,形成了貫穿前後板卡的高速、通暢的氣流。

  總結

  下表將對以上三種架構做出總結:

  對於高階機架式交換機,以Crossbar交換架構和CLOS交換架構為主。其中CLOS交換架構是當前大容量資料中心核心交換機的理想架構。銳捷網路RG-N18000-X系列交換機基於無阻塞的CLOS架構,並且首次採用“零背板”技術,在提供高效、穩定交換服務的同時,可實現未來10年網路可持續平滑升級。