網路效能指標構成資料中心挑戰
網路世界因為思維模式的廣泛變化而聞名,並通常驅動著網路行業的炒作週期。其中有很多模式轉變,例如集中控制平臺、分散控制平臺,以及各種路由協議和範例。
目前正在發生的一個主要變化是支援公共雲或私有云的葉脊資料中心結構,可以將其視為將網路、計算和儲存資源作為計算能力單元進行的銷售。
資料中心結構通常基於最初為電話網路設計的CLOS結構,其中准入控制是服務質量的主要手段。在電路交換領域,網路效能指標主要是分配固定數量的頻寬,如果沒有可用頻寬,則拒絕允許連線。
這些最初的LOS網路已經通過摺疊(或雙向傳遞流量)和構建不同的變體(如Benes和Butter)來適應計算機網路。這些更通用的葉脊網路對網路效能指標提出了超出導納控制的挑戰。
以下是網路面臨的一些挑戰。
例如在一個網路中,主機1和主機2之間有256條路徑。那麼可以收集哪種網路效能指標來了解網路的執行情況?
收集每個介面的佇列深度、丟棄數量和傳輸控制協議重傳將提供網路效能的可靠通用檢視。但是,除了這個抽象檢視之外,很難看到如何收集有助於任何一個應用程式更高效地操作的資訊。
這是一個更具體的示例:如果應用程式效能不佳,並且懷疑問題出在網路中,那麼將在哪裡開始故障排除?很難通過這些型別的寬泛等價多路徑網路跟蹤任何資料包或資料包流的路徑,以確定可能存在問題的位置。
一個可能的答案是向網路新增更多狀態,尤其是在網路效能指標中。例如,如果使用IPv6版本的分段路由(SRv6),則可以為網路接受的每個資料包新增一個報頭,並在資料包報頭上新增路徑列表。
由於SRv6在交換過程中不會刪除或修改此標頭,因此檢查路徑中任何一點的資料包報頭將顯示資料包已通過網路的路徑。有許多不同的方法,可以通過網路新增跟蹤單個流所需的資訊型別,但每種方法還涉及另一種權衡。
新增這些網路效能指標可能會產生大量新資訊,網路管理系統必須消耗、管理、分類和考慮。在對問題進行故障排除、容量規劃以及通常瞭解網路健康狀況的過程中,人們也必須消耗這些資訊洪流。這些問題尚未得到完全解決,但它們可能是研究、機器學習以及網路管理系統設計和部署中更強大架構方法的新方向。