CPU和GPU擅長和不擅長的地方

阿新 • • 發佈：2019-01-05

CPU和GPU都是具有運算能力的晶片，CPU更像“通才”——指令運算(執行)為重+ 數值運算，GPU更像“專才”——圖形類數值計算為核心。在不同型別的運算方面的速度也就決定了它們的能力——“擅長和不擅長”。

晶片的速度主要取決於三個方面：微架構、主頻、IPC(每個時鐘週期執行的指令數)。

1．微架構

從微架構上看，CPU和GPU看起來完全不是按照相同的設計思路設計的，當代CPU的微架構是按照兼顧“指令並行執行”和“資料並行運算”的思路而設計，就是要兼顧程式執行和資料運算的並行性、通用性以及它們的平衡性。CPU的微架構偏重於程式執行的效率，不會一味追求某種運算極致速度而犧牲程式執行的效率。

CPU微架構的設計是面向指令執行高效率而設計的，因而CPU是計算機中設計最複雜的晶片。和GPU相比，CPU核心的重複設計部分不多，這種複雜性不能僅以電晶體的多寡來衡量，這種複雜性來自於實現：如程式分支預測，推測執行，多重巢狀分支執行，並行執行時候的指令相關性和資料相關性，多核協同處理時候的資料一致性等等複雜邏輯。

GPU其實是由硬體實現的一組圖形函式的集合，這些函式主要用於繪製各種圖形所需要的運算。這些和畫素，光影處理，3D 座標變換等相關的運算由GPU硬體加速來實現。圖形運算的特點是大量同類型資料的密集運算——如圖形資料的矩陣運算，GPU的微架構就是面向適合於矩陣型別的數值計算而設計的，大量重複設計的計算單元，這類計算可以分成眾多獨立的數值計算——大量數值運算的執行緒，而且資料之間沒有像程式執行的那種邏輯關聯性。

GPU微架構複雜度不高，儘管電晶體的數量不少。從應用的角度看，如何運用好GPU的平行計算能力主要的工作是開發好它的驅動程式。GPU驅動程式的優劣很大程度左右了GPU實際效能的發揮。

因此從微架構上看，CPU擅長的是像作業系統、系統軟體和通用應用程式這類擁有複雜指令排程、迴圈、分支、邏輯判斷以及執行等的程式任務。嵌入式學習加騰訊意義氣嗚嗚吧久零就易，它的並行優勢是程式執行層面的，程式邏輯的複雜度也限定了程式執行的指令並行性，上百個並行程式執行的執行緒基本看不到。GPU擅長的是圖形類的或者是非圖形類的高度並行數值計算，GPU可以容納上千個沒有邏輯關係的數值計算執行緒，它的優勢是無邏輯關係資料的平行計算。

2．主頻

另外，GPU執行每個數值計算的速度並沒有比CPU快，從目前主流CPU和GPU的主頻就可以看出了，CPU的主頻都超過了1GHz，2GHz，甚至3GHz，而GPU的主頻最高還不到1GHz，主流的也就500~600MHz。要知道1GHz = 1000MHz。所以GPU在執行少量執行緒的數值計算時並不能超過CPU。

目前GPU數值計算的優勢主要是浮點運算，它執行浮點運算快是靠大量並行，但是這種數值運算的並行性在面對程式的邏輯執行時毫無用處。

3．IPC

(每個時鐘週期執行的指令數)

這個方面，CPU和GPU無法比較，因為GPU大多數指令都是面向數值計算的，少量的控制指令也無法被作業系統和軟體直接使用。如果比較資料指令的IPC，GPU顯然要高過CPU，因為並行的原因。但是，如果比較控制指令的IPC，自然是CPU的要高的多。原因很簡單，CPU著重的是指令執行的並行性。

另外，目前有些GPU也能夠支援比較複雜的控制指令，比如條件轉移、分支、迴圈和子程式呼叫等，但是GPU程式控制這方面的增加，和支援作業系統所需要的能力CPU相比還是天壤之別，而且指令執行的效率也無法和CPU相提並論。

最後總結一下：

CPU擅長的：作業系統，系統軟體，應用程式，通用計算，系統控制等等；遊戲中人工智慧，物理模擬等等；3D建模-光線追蹤渲染；虛擬化技術——抽象硬體，同時執行多個作業系統或者一個作業系統的多個副本等等。

GPU擅長的：圖形類矩陣運算，非圖形類並行數值計算，高階3D遊戲。

綜上所述，在一臺均衡計算的計算機系統中，CPU和GPU還是各司其職，除了圖形運算，GPU將來可能主要集中在高效率低成本的高效能並行數值計算，幫助CPU分擔這種型別的計算，提高系統這方面的效能。而當前的典型應用還是高階3D遊戲，一個高效的GPU配合一個高效的CPU，3D遊戲的整體效率才能得到保證。“高階3D遊戲只需要高階顯示卡”或者“高階3D遊戲只需要CPU”都是無稽之談。

CPU和GPU擅長和不擅長的地方

CPU和GPU擅長和不擅長的地方

近日有需要寫點C#程式，有用到Dataset資料集和SQLite資料庫，由於我從來就不擅長記各種程式語言的語法，所以在查閱一堆資料後，留下以下內容備忘：一、SQLite操作，直接貼程式碼，很簡單

CPU和GPU雙低效，摩爾定律之後一萬倍 ——寫於TPU版AlphaGo重出江湖之際

Shader 入門筆記(二) CPU和GPU之間的通信

Linux下檢視CPU和GPU使用情況

取模乘法和除法運算在CPU和GPU上的效率

Linux環境下如何查看內存CPU和GPU使用情況以及界面標題欄實現

ubuntu 16.04 安裝Tensorflow(CPU和GPU)

Caffe原始碼理解2：SyncedMemory CPU和GPU間的資料同步

CPU（中央處理器）和GPU（影象處理器）區別

tensorflow的CPU和GPU的區別

Linux系統中如何檢視CPU和GPU佔用率

CPU（中央處理器）和GPU（影象處理器）區別大揭祕

ubuntu 16.04 環境安裝faiss（ CPU和GPU）

ios視訊處理中CPU和GPU的高效連線橋樑——共享記憶體（CVPixelBufferRef）

Win10下安裝tensorflow教程（cpu版本和GPU版本）

PyTorch學習筆記(3)—CPU和GPU上載入模型

FPGA為什麼比CPU和GPU快

CPU和GPU計算的優缺點分析

關於tensorflow gpu版和cpu版網上說的容易混淆的一點

CPU和GPU擅長和不擅長的地方

相關推薦