牙膏時代結束!Intel釋出全新Sunny Cove架構,最快2019年下半年面世
雷鋒網 (公眾號:雷鋒網) 訊息,北京時間12月12日晚,在聖克拉拉舉辦的架構日活動上,Intel高階副總裁兼矽工程師集團總經理Jim Keller公開展示了一系列處於研發中的基於10nm的系統,將用於PC、資料中心和網路裝置,並預覽了其他針對更廣泛工作負載的技術,其中最吸引人的便是基於10nm的 下一代“Sunny Cove”處理器架構 。
據悉,Sunny Cove架構旨在提高通用計算任務下每時鐘計算效能和降低功耗,幷包含了可加速人工智慧和加密等專用計算任務的新功能。明年晚些時候,Sunny Cove將成為Intel下一代PC和伺服器處理器的基礎架構。
Sunny Cove能夠減少延遲、提高吞吐量,並提供更高的平行計算能力,有望改善從遊戲到多媒體到以資料為中心的應用體驗,其功能特性包括:
-
增強的微架構,可並行執行更多操作。
-
可降低延遲的新演算法。
-
增加關鍵緩衝區和快取的大小,可優化以資料為中心的工作負載。
-
針對特定用例和演算法的架構擴充套件。例如,提升加密效能的新指令,如向量AES和SHA-NI,以及壓縮/解壓縮等其它關鍵用例。
同時,Intel首席架構師、核心與視覺計算集團高階副總裁兼邊緣計算解決方案總經理Raja Koduri向大家介紹了全新的 Gen 11核心顯示卡 ,並重申了在2020年推出獨立圖形處理器的計劃。
Gen 11核心顯示卡將於2019年開始隨10nm處理器一同面世,配備64個EUs(增強型執行單元),運算規模是此前Gen 9核心顯示卡的2倍,浮點運算效能超過1TFlops,並採用Intel自適應同步技術,旨在提高遊戲的可玩性。該顯示卡還將採用業界領先的媒體編碼器和解碼器,在有限的功耗下支援4K視訊流和8K內容創作。
此外,Intel還在活動上介紹了傲騰技術、Foveros邏輯晶片3D堆疊技術、One API軟體以及深度學習參考堆疊等內容。
邏輯晶片3D堆疊技術:繼2018年英特爾推出EMIB(嵌入式多晶片互連橋接)2D封裝技術之後,Intel此次展示了業界首創的名為Foveros的全新邏輯晶片3D堆疊技術,可實現在邏輯晶片上堆疊邏輯晶片。
該技術有望首次將晶片的堆疊從傳統的無源中間互連層和堆疊儲存晶片擴充套件到CPU、GPU和AI處理器等高效能邏輯晶片,為整合高效能、高密度和低功耗矽工藝技術的器件和系統鋪平了道路。設計人員可在新的產品形態中“混搭”不同的技術專利模組與各種儲存晶片和I/O配置。並使得產品能夠分解成更小的“晶片組合”,其中I/O、SRAM和電源傳輸電路可以整合在基礎晶片中,而高效能邏輯“晶片組合”則堆疊在頂部。
Intel預計將從2019年下半年開始推出一系列採用Foveros技術的產品。首款Foveros產品將整合高效能10nm計算堆疊“晶片組合”和低功耗22FFL基礎晶片。它將在小巧的產品形態中實現世界一流的效能與功耗效率。
One API軟體:Intel宣佈推出“One API”專案,以簡化跨CPU、GPU、FPGA、人工智慧和其它加速器的各種計算引擎的程式設計。該專案包括一個全面、統一的開發工具組合,以將軟體匹配到能最大程度加速軟體程式碼的硬體上。公開發行版本預計將於2019年釋出。
傲騰技術:Intel傲騰資料中心級持久記憶體作為一款新產品,集成了記憶體般的效能以及資料的永續性和儲存的大容量。這項技術通過將更多資料放到更接近CPU的位置,使應用在人工智慧和大型資料庫中的更大量的資料集能夠獲得更快的處理速度。其大容量和資料的永續性減少了對儲存進行訪問時的時延損失,從而提高工作負載的效能。
Intel傲騰資料中心級持久記憶體為CPU提供快取行(64B)讀取。一般來說,當應用把讀取操作定向到傲騰持久記憶體或請求的資料不在DRAM中快取時,傲騰持久記憶體的平均空閒讀取延遲大約為350ns。如果實現規模化,傲騰資料中心級固態盤的平均空閒讀取延遲約為10000ns(10μs),這將是顯著的改進。在某些情況下,當請求的資料在DRAM中時,不管是通過CPU的記憶體控制器進行快取還是由應用所引導,記憶體子系統的響應速度預計與DRAM相同(小於100 ns)。
Intel還展示了傲騰與QLC固態硬碟的結合,將降低對最常用資料的訪問延遲。總體來說,這些對平臺和記憶體的改進重塑了記憶體和儲存層次結構,從而為系統和應用提供了完善的選擇組合。
深度學習參考堆疊(Deep Learning Reference Stack):這是一個整合、高效能的開源堆疊,基於Intel至強可擴充套件平臺進行了優化。該開源社群版本旨在確保人工智慧開發者可以輕鬆訪問Intel平臺的所有特性和功能。深度學習參考堆疊經過高度調優,專為雲原生環境而構建。該版本可以降低整合多個軟體元件所帶來的複雜性,幫助開發人員快速進行原型開發,同時讓使用者有足夠的靈活度打造定製化的解決方案。
-
作業系統:Clear Linux 作業系統可根據個人開發需求進行定製,針對Intel平臺以及深度學習等特定用例進行了調優;
-
編排:Kubernetes可基於對Intel平臺的感知,管理和編排面向多節點叢集的容器化應用;
-
容器:Docker容器和Kata容器利用Intel虛擬化技術來幫助保護容器;
-
執行時:Python針對Intel架構進行了高度調優和優化,提供應用和服務執行執行時支援;
-
框架:TensorFlow是一個領先的深度學習和機器學習框架;
-
部署:KubeFlow是一個開源、行業驅動型部署工具,在Intel架構上提供快速體驗,易於安裝和使用。
雷鋒網原創文章,未經授權禁止轉載。詳情見 ofollow,noindex" target="_blank">轉載須知 。
