科學家開發多GPU結構晶圓計算機 希望突破資料鏈路瓶頸
伊利諾伊大學香檳分校和加州大學洛杉機分校的科研團隊正在研發一臺晶圓級計算機架構, 其目標旨在構建多GPU晶片以晶片資料內連連線(interconnect)的高效計算系統,實現內部資料互連的速率和能效,突破資料鏈路導致的效能瓶頸。
超級計算機中通常將一個任務應用負載分散至單獨的印刷電路板的多GPU計算單元,這些GPU單元通過長途資料鏈路相互通訊。資料鏈路成為了主要的瓶頸,因為它們的傳輸速度比晶片內部資料互連要慢得多。
此外,“晶片和印刷電路板的存在機械性的不匹配”。意味著這些處理器必須包含在晶片封裝內,但這些封裝在輸入/輸出次數上是有限制的。
綜合起來資料鏈路就會產生顯著的效能瓶頸。如果是在理想情況下,多GPU模組間資料通訊可以和晶片內部資料互連的速度/能效一樣高。
一種方法是把所有GPU都整合入同一塊矽晶圓的計算機,並且用晶片內連連線它們。從規模生產上來看這種方法不現實,如果整合40個GPU入一個晶圓就足夠製造工藝災難,很難保證如此規模專案中不存在某個製造瑕疵。
研究團隊採用了另一種方法:他們稱之為矽互連結構(SiIF)的新技術,使用通過質量測試的標準GPU晶片,並用緊密整合的SiIF結構更好地連線它們。從工程師的角度來看,其效能就是一個巨型的怪獸級GPU晶片,而非40個獨立GPU晶片並聯計算。
這種多GPU效能怪物的模擬計算速度提升19倍,並將綜合能耗和訊號延遲的削減了140多倍。
伊利諾伊的計算機工程助理教授Rakesh Kumar和他的同事們已經開始建造晶圓級原型,有望在2月IEEE國際高效能運算機體系結構研討會上展示他們的研究成果