1. 程式人生 > >CPU和GPU擅長和不擅長的地方

CPU和GPU擅長和不擅長的地方

CPU和GPU都是具有運算能力的晶片,CPU更像“通才”——指令運算(執行)為重+ 數值運算,GPU更像“專才”——圖形類數值計算為核心。在不同型別的運算方面的速度也就決定了它們的能力——“擅長和不擅長”。

晶片的速度主要取決於三個方面:微架構、主頻、IPC(每個時鐘週期執行的指令數)。

1.微架構

從微架構上看,CPU和GPU看起來完全不是按照相同的設計思路設計的,當代CPU的微架構是按照兼顧“指令並行執行”和“資料並行運算”的思路而設計,就是要兼顧程式執行和資料運算的並行性、通用性以及它們的平衡性。CPU的微架構偏重於程式執行的效率,不會一味追求某種運算極致速度而犧牲程式執行的效率。

CPU微架構的設計是面向指令執行高效率而設計的,因而CPU是計算機中設計最複雜的晶片。和GPU相比,CPU核心的重複設計部分不多,這種複雜性不能僅以電晶體的多寡來衡量,這種複雜性來自於實現:如程式分支預測,推測執行,多重巢狀分支執行,並行執行時候的指令相關性和資料相關性,多核協同處理時候的資料一致性等等複雜邏輯。

GPU其實是由硬體實現的一組圖形函式的集合,這些函式主要用於繪製各種圖形所需要的運算。這些和畫素,光影處理,3D 座標變換等相關的運算由GPU硬體加速來實現。圖形運算的特點是大量同類型資料的密集運算——如圖形資料的矩陣運算,GPU的微架構就是面向適合於矩陣型別的數值計算而設計的,大量重複設計的計算單元,這類計算可以分成眾多獨立的數值計算——大量數值運算的執行緒,而且資料之間沒有像程式執行的那種邏輯關聯性。

GPU微架構複雜度不高,儘管電晶體的數量不少。從應用的角度看,如何運用好GPU的平行計算能力主要的工作是開發好它的驅動程式。GPU驅動程式的優劣很大程度左右了GPU實際效能的發揮。

因此從微架構上看,CPU擅長的是像作業系統、系統軟體和通用應用程式這類擁有複雜指令排程、迴圈、分支、邏輯判斷以及執行等的程式任務。嵌入式學習加騰訊意義氣嗚嗚吧久零就易,它的並行優勢是程式執行層面的,程式邏輯的複雜度也限定了程式執行的指令並行性,上百個並行程式執行的執行緒基本看不到。GPU擅長的是圖形類的或者是非圖形類的高度並行數值計算,GPU可以容納上千個沒有邏輯關係的數值計算執行緒,它的優勢是無邏輯關係資料的平行計算。

2.主頻

另外,GPU執行每個數值計算的速度並沒有比CPU快,從目前主流CPU和GPU的主頻就可以看出了,CPU的主頻都超過了1GHz,2GHz,甚至3GHz,而GPU的主頻最高還不到1GHz,主流的也就500~600MHz。要知道1GHz = 1000MHz。所以GPU在執行少量執行緒的數值計算時並不能超過CPU。

目前GPU數值計算的優勢主要是浮點運算,它執行浮點運算快是靠大量並行,但是這種數值運算的並行性在面對程式的邏輯執行時毫無用處。

3.IPC

(每個時鐘週期執行的指令數)

這個方面,CPU和GPU無法比較,因為GPU大多數指令都是面向數值計算的,少量的控制指令也無法被作業系統和軟體直接使用。如果比較資料指令的IPC,GPU顯然要高過CPU,因為並行的原因。但是,如果比較控制指令的IPC,自然是CPU的要高的多。原因很簡單,CPU著重的是指令執行的並行性。

另外,目前有些GPU也能夠支援比較複雜的控制指令,比如條件轉移、分支、迴圈和子程式呼叫等,但是GPU程式控制這方面的增加,和支援作業系統所需要的能力CPU相比還是天壤之別,而且指令執行的效率也無法和CPU相提並論。

最後總結一下:

CPU擅長的:作業系統,系統軟體,應用程式,通用計算,系統控制等等;遊戲中人工智慧,物理模擬等等;3D建模-光線追蹤渲染;虛擬化技術——抽象硬體,同時執行多個作業系統或者一個作業系統的多個副本等等。

GPU擅長的:圖形類矩陣運算,非圖形類並行數值計算,高階3D遊戲。

綜上所述,在一臺均衡計算的計算機系統中,CPU和GPU還是各司其職,除了圖形運算,GPU將來可能主要集中在高效率低成本的高效能並行數值計算,幫助CPU分擔這種型別的計算,提高系統這方面的效能。而當前的典型應用還是高階3D遊戲,一個高效的GPU配合一個高效的CPU,3D遊戲的整體效率才能得到保證。“高階3D遊戲只需要高階顯示卡”或者“高階3D遊戲只需要CPU”都是無稽之談。