1. 程式人生 > >HPC高效能運算知識: 基礎科普

HPC高效能運算知識: 基礎科普

      在過去15年的時間裡,HPC一直是增長最快的IT市場之一,其增長速度有時超過了線上遊戲、平板的年增長率。

HPC高效能運算市場空間有多大?

      在2016年的全年,我們報告說,HPC伺服器市場的全球工廠收入從2015年的107億美元上升到創紀錄的112億美元,比2003年的57億美元增長了近兩倍(其他市場分析,請參看“[解讀] Intersect360分析預測: 由AI和Cloud驅動,未來HPC市場達439億”),研究預測,HPC伺服器市場將在2021年增長到148億美元,而整個HPC生態系統的市場在那一年將會超過300億美元的市場。

什麼是高效能運算,涉及哪些技術和知識呢?

      高效能運算(High performance computing) 指通常使用很多處理器(作為單個機器的一部分)或者某一叢集中組織的幾臺計算機(作為單個計算資源操作)的計算系統和環境。高效能叢集上執行的應用程式一般使用並行演算法,把一個大的普通問題根據一定的規則分為許多小的子問題,在叢集內的不同節點上進行計算,而這些小問題的處理結果,經過處理可合併為原問題的最終結果。由於這些小問題的計算一般是可以並行完成的,從而可以縮短問題的處理時間。

      高效能叢集在計算過程中,各節點是協同工作的,它們分別處理大問題的一部分,並在處理中根據需要進行資料交換,各節點的處理結果都是最終結果的一部分。高效能叢集的處理能力與叢集的規模成正比,是叢集內各節點處理能力之和,但這種叢集一般沒有高可用性。高效能運算的分類方法很多。這裡從並行任務間的關係角度來對高效能運算分類。

  • 一、高吞吐計算(High-throughput Computing)

      有一類高效能運算,可以把它分成若干可以並行的子任務,而且各個子任務彼此間沒有什麼關聯。因為這種型別應用的一個共同特徵是在海量資料上搜索某些特定模式,所以把這類計算稱為高吞吐計算。所謂的Internet計算都屬於這一類。按照Flynn的分類,高吞吐計算屬於SIMDSingle Instruction/Multiple Data,單指令流-多資料流)的範疇。

  • 二、分佈計算(Distributed Computing)

      另一類計算剛好和高吞吐計算相反,它們雖然可以給分成若干並行的子任務,但是子任務間聯絡很緊密,需要大量的資料交換。按照Flynn的分類,分散式的高效能運算屬於MIMD(Multiple Instruction/Multiple Data,多指令流-多資料流)的範疇。

      有許多型別的HPC 系統,其範圍從標準計算機的大型叢集,到高度專用的硬體。大多數基於叢集的HPC系統使用高效能網路互連,基本的網路拓撲和組織可以使用一個簡單的匯流排拓撲。HPC系統由計算、儲存、網路、叢集軟體四部分組成。

高效能運算HPC系統技術特點是什麼?

      HPC系統目前主流處理器是X86處理器,作業系統是linux 系統(包括Intel、AMD、NEC、Power、PowerPC、Sparc等)、構建方式採用刀片系統,網際網路絡使用IB和10GE。

      高效能運算HPC叢集中計算節點一般 分3種: MPI節點、胖節點、GPU加速節點。雙路節點稱為瘦節點(MPI節點),雙路以上稱為胖節點;胖節點配置大容量記憶體;叢集中胖節點的數量要根據實際應用需求而定。

      GPU英文全稱Graphic Processing Unit,中文翻譯為圖形處理器。 在浮點運算、平行計算等部分計算方面,GPU可以提供數十倍乃至於上百倍於CPU的效能。目前GPU廠家只有三家NVIDIA GPU、AMD GPU和Intel Xeon PHI。可選擇的GPU種類比較少。

  • NVIDIA 的GPU卡分圖形卡和計算卡,圖形卡有NVIDA K2000與K4000,計算卡K20X/K40M/K80 。

  • Intel 的GPU是Intel Xeon Phi 系列,屬於計算卡,主要產品有Phi 5110P 、Phi 3210P、Phi 7120P、Phi 31S1P。

  • AMD 的GPU是圖形和計算合一,主要產品有W5000、W9100、S7000、S9000、S10000。

高效能運算的效能指標怎樣衡量?

      CPU的效能計算公式: 單節點效能=處理器主頻*核數*單節點CPU數量*單週期指令數。單週期指令數=8(E5-2600/E5-2600 v2/E7-4800 v2)或16(E5-2600 v3);節點數量=峰值浮點效能需求/單節點效能。

      時延( 記憶體和磁碟訪問延時)是計算的另一個性能衡量指標,在HPC系統中,一般時延要求如下:

  • 一個MFlops等於每秒一佰萬(=10^6)次的浮點運算;

  • 一個GFlops等於每秒拾億(=10^9)次的浮點運算;

  • 一個TFlops等於每秒一萬億(=10^12)次的浮點運算,(1太拉);

  • 一個PFlops等於每秒一千萬億(=10^15)次的浮點運算;

  • 一個EFlops等於每秒一佰京(=10^18)次的浮點運算。

測試工具—Linpack HPC是什麼?

      Linpack HPC 是效能測試工具。LINPACK是線性系統軟體包(Linear system package) 的縮寫, 主要開始於 1974 年 4 月, 美國Argonne 國家實驗室應用數學所主任 Jim Pool, 在一系列非正式的討論會中評估,建立一套專門解線性系統問題之數學軟體的可能性。

      業界還有其他多種測試基準,有的是基於實際的應用種類如TPC-C,有的是測試系統的某一部分的效能,如測試硬碟吞吐能力的IOmeter,測試記憶體頻寬的stream。

      至目前為止, Linpack 還是廣泛地應用於解各種數學和工程問題。也由於它高效率的運算, 使得其它幾種數學軟體例如IMSL、MatLab紛紛加以引用來處理矩陣問題,所以足見其在科學計算上有舉足輕重的地位。

      Linpack現在在國際上已經成為最流行的用於測試高效能運算機系統浮點效能的Benchmark。通過利用高效能運算機,用高斯消元法求解N元一次稠密線性代數方程組的測試,評價高效能運算機的浮點效能。

雙列直插式記憶體(DIMM)有幾種型別?

      雙列直插式記憶體(DIMM)包括UDIMM記憶體、RDIMM記憶體和LRDIMM記憶體三種DIMM記憶體可用型別。

  • 在處理較大型工作負載時,無緩衝DIMM( UDIMM )速度快、廉價但不穩定。

  • 暫存器式DIMM( RDIMM )記憶體穩定、擴充套件性好、昂貴,而且對記憶體控制器的電氣壓力小。它們同樣在許多傳統伺服器上使用。

  • 降載 DIMM( LRDIMM )記憶體是暫存器式記憶體( RDIMM )的替代品,它們能提供高記憶體速度,降低伺服器記憶體匯流排的負載,而且功耗更低。LRDIMM記憶體成本比 RDIMM記憶體高非常多,但在高效能運算架構中十分常見。

非易失雙列直插式記憶體NVDIMM是什麼?

      NVDIMM由BBU(Battery Backed Up) DIMM演變而來。BBU採用後備電池以維持普通揮發性記憶體中的內容幾小時之久。但是,電池含有重金屬,廢棄處置和對環境的汙染,不符合綠色能源的要求。由超級電容作為動力源的NVDIMM應運而生。並且NVDIMM使用非揮發性的Flash儲存介質來儲存資料,資料能夠儲存的時間更長。

主流高效能運算網路型別有哪些?

      InfiniBand架構是一種支援多併發連結的“轉換線纜”技術,InfiniBand技術不是用於一般網路連線的,它的主要設計目的是針對伺服器端的連線問題的。因此,InfiniBand技術將會被應用於伺服器與伺服器(比如複製,分散式工作等),伺服器和儲存裝置(比如SAN和直接儲存附件)以及伺服器和網路之間(比如LAN,WANs和網際網路)的通訊。高效能運算HPC系統為什麼要使用IB互聯?主要原因是IB協議棧簡單,處理效率高,管理簡單,對RDMA支援好,功耗低,時延低。

      目前只有Mexllaon、Intel、Qlogic提供IB產品,Mexllaon是主要玩家,處於主導地位, IB目前支援FDR和QDR、EDR。

      Host Channel Adapters (HCA)是IB連線的裝置終結點,提供傳輸功能和Verb介面;Target Channel Adapters (TCA)是HCA的子集,基本上用於儲存。

      RDMA(Remote Direct Memory Access)技術全稱遠端直接資料存取,就是為了解決網路傳輸中伺服器端資料處理的延遲而產生的。RDMA通過網路把資料直接傳入計算機的儲存區,將資料從一個系統快速移動到遠端系統儲存器中,實現Zero Copy。

高效能運算的靈魂—並行檔案系統

      TOP500 HPC系統中儲存主要使用分散式檔案系統,分散式檔案系統(Distributed File System)可以有效解決資料的儲存和管理難題: 將固定於某個地點的某個檔案系統,擴充套件到任意多個地點/多個檔案系統,眾多的節點組成一個檔案系統網路。每個節點可以分佈在不同的地點,通過網路進行節點間的通訊和資料傳輸。人們在使用分散式檔案系統時,無需關心資料是儲存在哪個節點上、或者是從哪個節點從獲取的,只需要像使用本地檔案系統一樣管理和儲存檔案系統中的資料。

      分散式檔案系統的設計基於客戶機/伺服器模式。一個典型的網路可能包括多個供多使用者訪問的伺服器。當前主流的分散式檔案系統包括: Lustre、Hadoop、MogileFS、FreeNAS、FastDFS、NFS、OpenAFS、MooseFS、pNFS、以及GoogleFS等,其中Lustre、GPFS是HPC最主流的(本號歷史文章做過大量介紹和分析,請參看文章“從高效能運算(HPC)技術演變解析方案、生態和行業發展趨勢”)。

>>>>>>>>>>>>>>擴充套件閱讀<<<<<<<<<<<<<<

溫馨提示:
請搜尋“ICT_Architect”“掃一掃”二維碼關注公眾號,點選原文連結獲取更多HPC技術資料

相關推薦

HPC高效能運算知識: 基礎科普

      在過去15年的時間裡,HPC一直是增長最快的IT市場之一,其增長速度有時超過了線上遊戲、平板的年增長率。HPC高效能運算市場空間有多大?      在2016年的全年,我們報告說,HPC伺服

HPC高效能運算知識: 深度解析Lustre體系結構

文章轉自“Lustre檔案系統與DDN”      Lustre架構是一種叢集儲存體系結構,其核心元件就是Lustre檔案系統。該檔案系統可在Linux作業系統上執行,並提供了符合POSIX標準的UNIX檔案系統介面。Lustre檔案系統是什麼      Lustre架構用於

HPC 高效能叢集基礎環境安裝

1、HPC 基礎環境配置1.1、作業系統 配置 作業系統:redhat enterprise linuxt 6 管理節點:HOSTNAME:desktop IP:192.168.199.132計算節點: HOSTNAME:c1 IP:192.168.199.133 HOSTNAME:c2 IP:192.1

深度學習FPGA實現基礎知識20(FPGA小數運算--DSP基礎“定點小數運算”)

需求說明:深度學習FPGA實現知識儲備 來自:第一部分  DSP基礎--定點小數運算           第二部分  dsp定點運算基本方法 整理來自:時間的詩 第一部分  DSP基礎--定點小數運算 在DSP世界中,由於DSP晶片的限制,經常使用定點小數運

高效能運算(HPC)_AWS高效能運算服務

AWS 網路專為擴充套件而設計。無論您的應用程式是需要將數千個核心用於一個緊密耦合的工作負載,或是需要將數十萬個核心用於高度並行、高吞吐量計算 (HTC) 應用程式,還是同時需要兩者,AWS 網路均可提供相應的效能 (高頻寬、低延遲) 和可擴充套件性。

高效能運算(HPC)入門_AWS高效能運算服務

Amazon Web Services 誠聘精英。 Amazon Web Services (AWS) 是 Amazon.com 的一個充滿活力、不斷壯大的業務部門。我們現誠聘軟體開發工程師、產品經理、客戶經理、解決方案架構師、支援工程師、系統工程師以及設計師等人才。請訪問我

關於高效能運算知識記錄彙總-菜鳥級別

最近花了點時間,對openmp,opencl,mpi(有多種實現,如open MPI)等,關於高效能運算的技術,做了一下簡單的瀏覽,我把這次簡單瀏覽所學習到的一點東西記錄在此。這些總結和記錄都比較半吊子,還需要更深入的學習和研究。 首先,時下越來越熱的gpu計算,隨著中國天津的大型計算機拿到國際頭把運

IS360高效能運算(HPC)儲存市場報告解析(含報告)

      Intersect360釋出了儲存市場報告,本報告只是HPC使用者普報告系列的一部分

JavaScript 面向對象開發知識基礎總結

{} 生存 fin 未定義 分配 編譯期 內部 有序列表 java JavaScript 面向對象開發知識基礎總結 最近看了兩本書,書中有些內容對自己還是很新的,有些內容是之前自己理解不夠深的,所以拿出來總結一下,這兩本書的名字如下: JavaScript 面向對象精

ARM推出高效能運算品牌Neoverse:單路可達96核、1TB/s頻寬

在日前舉行的ARM Techcon 2018大會上,ARM公司推出了Neoverse品牌,它跟Cortex-A雖然都是基於ARM指令集的IP產品,不過主要面向高效能運算市場,單插槽可配置最多96個CPU核心,頻寬可達1TB/s,還有64MB系統快取。 本文約532字,需1分鐘閱讀 現在的PC電

CUDA GPU高效能運算

分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!        

美超微提供最高效能,幫助廣泛高效能運算應用實現突破

-SC18將展出業界最廣泛的高效能運算系統,包括千萬億次全快閃記憶體NVMe、BigTwin (TM)、SuperBlade®和人工智慧與深度學習GPU系統 達拉斯2018年11月13日電 /美通社/ -- 企業計算、儲存、網路解決方案

領銜創新,曙光新一代矽立方高效能運算機亮相SC18

得克薩斯州達拉斯市2018年11月13日電 /美通社/ -- 11月11日~16日,全球超算領域的年度盛會 -- 全球超級計算大會(SC18)在美國得克薩斯州達拉斯市拉開帷幕。本屆大會以“HPC Inspires”為主題,點燃起業界人士對於高效能運算機(HPC)巨大潛力的期待。作為中國超

#Java程式設計師福利:3分鐘知道Android開發所需要知道的知識基礎

今年的Google IO 大會上,Google宣佈Kotlin成為Android的官方語言,有興趣的可以去學習下,Java作為android的第一個語言,還是需要把打這部分知識打牢固的。(這部分內容只是當作自己的複習) 1、三大特性 Java做為面向物件的語言,他的三大特性:繼承、封裝、多型

中國計算機學會推薦國際學術會議----計算機系統與高效能運算

中國計算機學會推薦國際學術會議  (計算機系統與高效能運算) 一、A類 1 ASPLOS Architectural Support for Programming Languages and Operating Systems ACM http://www.acm.org/pubs

神經網路高效能運算 卷積計算優化 openblas GEMM 矩陣乘法優化 ncnn mobileNet-ssd shueezeNet-ssd

HighPerformanceComputing 高效能運算(High performance computing, 縮寫HPC) 指通常使用很多處理器(作為單個機器的一部分) 或者某一叢集中組織的幾臺計算機(作為單個計 算資源操作)的計算系統和環境。 有許多型別的HP

高效能Spark作業基礎:你必須知道的調優原則及建議

在大資料計算領域,Spark已經成為了越來越流行、越來越受歡迎的計算平臺之一。Spark的功能涵蓋了大資料領域的離線批處理、SQL類處理、流式/實時計算、機器學習、圖計算等各種不同型別的計算操作,應用範圍與前景非常廣泛。在美團點評,已經有很多同學在各種專案中嘗試使用Spark。大多數同學(包括筆者在內),最初

最基本財務基礎知識,財務知識基礎

六大要素為資產、負債、所有者權益、收入、費用、利潤。此六者構成了企業財務的全部。 關係具體如下: 資產由固定資產、流動資產等組成; 負債由流動負債、長期負債等組成; 所有者權益由實收資本、盈餘公積等組成; 收入由主營業務收入、營業外收入等組成; 費用由製造費用、經營費用、管理

航空航天空氣動力學高效能運算解決方案

科百華公司作為國內頂尖的高效能運算系統供應商,多年來致力於為我國航空航天界提供優秀的高效能運算解決方案,推動國內空氣動力學數值模擬研究的發展。 1.概述 傳統的飛行器氣動佈局設計主要依賴理論研究估算、設計師的經驗以及大量的風洞試驗結果,風洞試驗是主要設計工具。計算