CUDA從入門到精通到精通_筆記5:GPU入門綜述博文

阿新 • • 發佈：2019-01-01

PS：這篇部落格出自我的一個同學的手中，寫的很好，是CUDA入門的好部落格，因此才從他的部落格中複製過來（複製改版也是個力氣活~），大家也可以檢視他部落格中其它的文章，涉獵很廣，從語言到開源包。此外，他是做推薦系統的，如果有關於推薦系統的問題也可以在部落格給他留言~！

——————————————————正文——————————————————————
鑑於自己的畢設需要使用GPU CUDA這項技術，想找一本入門的教材，選擇了Jason Sanders等所著的書《CUDA By Example an Introduction to General Purpose GPU Programming》。這本書作為入門教材，寫的很不錯。自己覺得從理解與記憶的角度的出發，書中很多內容都可以被省略掉，於是就有了這篇博文。此博文記錄與總結此書的筆記和理解。注意本文並沒有按照書中章節的順序來寫。書中第8章影象互操作性和第11章多GPU系統上的CUDA C，這兩章沒有看。等有時間了再看吧，趕緊碼字。

CUDA是什麼
        CUDA，Compute Unified Device Architecture的簡稱，是由NVIDIA公司創立的基於他們公司生產的圖形處理器GPUs（Graphics Processing Units,可以通俗的理解為顯示卡）的一個平行計算平臺和程式設計模型。
        通過CUDA，GPUs可以很方便地被用來進行通用計算（有點像在CPU中進行的數值計算等等）。在沒有CUDA之前，GPUs一般只用來進行圖形渲染（如通過OpenGL，DirectX）。
        開發人員可以通過呼叫CUDA的API，來進行並行程式設計，達到高效能運算目的。NVIDIA公司為了吸引更多的開發人員，對CUDA進行了程式語言擴充套件，如CUDA C/C++,CUDA Fortran語言。注意CUDA C/C++可以看作一個新的程式語言，因為NVIDIA配置了相應的編譯器nvcc,CUDA Fortran一樣。更多資訊可以參考文獻。

64位Ubuntu12.04安裝CUDA5.5
具體步驟請點選此處http://bookc.github.io/2014/05/08/my-summery-the-book-cuda-by-example-an-introduction-to-general-purpose-gpu-programming/。
[b]對CUDA C的個人懵懂感覺[/b]
如果粗暴的認為C語言工作的物件是CPU和記憶體條（接下來,稱為主機記憶體），那麼CUDA C工作的的物件就是GPU及GPU上的記憶體（接下來,稱為裝置記憶體），且充分利用了GPU多核的優勢及降低了並行程式設計的難度。一般通過C語言把資料從外界讀入，再分配資料，給CUDA C，以便在GPU上計算，然後再把計算結果返回給C語言，以便進一步工作，如進一步處理及顯示，或重複此過程。

主要概念與名稱
主機
        將CPU及系統的記憶體（記憶體條）稱為主機。
裝置
        將GPU及GPU本身的顯示記憶體稱為裝置。
執行緒(Thread)
        一般通過GPU的一個核進行處理。（可以表示成一維，二維，三維，具體下面再細說）。
執行緒塊(Block)
        1. 由多個執行緒組成（可以表示成一維，二維，三維，具體下面再細說）。
        2. 各block是並行執行的，block間無法通訊，也沒有執行順序。
        3. 注意執行緒塊的數量限制為不超過65535（硬體限制）。
執行緒格(Grid)
        由多個執行緒塊組成（可以表示成一維，二維，三維，具體下面再細說）。

執行緒束
        在CUDA架構中，執行緒束是指一個包含32個執行緒的集合，這個執行緒集合被“編織在一起”並且“步調一致”的形式執行。在程式中的每一行，執行緒束中的每個執行緒都將在不同資料上執行相同的命令。
核函式（Kernel）
        1. 在GPU上執行的函式通常稱為核函式。
        2. 一般通過識別符號__global__修飾，呼叫通過<<<引數1,引數2>>>，用於說明核心函式中的執行緒數量，以及執行緒是如何組織的。
        3. 以執行緒格（Grid）的形式組織，每個執行緒格由若干個執行緒塊（block）組成，而每個執行緒塊又由若干個執行緒（thread）組成。
        4. 是以block為單位執行的。
        5. 叧能在主機端程式碼中呼叫。
        6. 呼叫時必須宣告核心函式的執行引數。
        7. 在程式設計時，必須先為kernel函式中用到的陣列或變數分配好足夠的空間，再呼叫kernel函式，否則在GPU計算時會發生錯誤，例如越界或報錯，甚至導致藍屏和宕機。
C/C++ code ?

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 /* * @file_name HelloWorld.cu 字尾名稱.cu */ #include <stdio.h> #include <cuda_runtime.h> //標頭檔案 //核函式宣告，前面的關鍵字__global__ __global__ void kernel( void ) { } int main( void ) { //核函式的呼叫，注意<<<1,1>>>，第一個1，代表執行緒格里只有一個執行緒塊；第二個1，代表一個執行緒塊裡只有一個執行緒。 kernel<<<1,1>>>(); printf( "Hello, World!\n" ); return 0; }

dim3結構型別
        1. dim3是基亍uint3定義的向量型別，相當亍由3個unsigned int型組成的結構體。uint3型別有三個資料成員unsigned int x; unsigned int y; unsigned int z;
        2. 可使用亍一維、二維或三維的索引來標識執行緒，構成一維、二維或三維執行緒塊。
        3. dim3結構型別變數用在核函式呼叫的<<<,>>>中。
        4. 相關的幾個內建變數
        4.1. threadIdx，顧名思義獲取執行緒thread的ID索引；如果執行緒是一維的那麼就取threadIdx.x，二維的還可以多取到一個值threadIdx.y，以此類推到三維threadIdx.z。
        4.2. blockIdx，執行緒塊的ID索引；同樣有blockIdx.x，blockIdx.y，blockIdx.z。
        4.3. blockDim，執行緒塊的維度，同樣有blockDim.x，blockDim.y，blockDim.z。
        4.4. gridDim，執行緒格的維度，同樣有gridDim.x，gridDim.y，gridDim.z。
        5. 對於一維的block，執行緒的threadID=threadIdx.x。
        6. 對於大小為（blockDim.x, blockDim.y）的二維 block，執行緒的threadID=threadIdx.x+threadIdx.y*blockDim.x。
        7. 對於大小為（blockDim.x, blockDim.y, blockDim.z）的三維 block，執行緒的threadID=threadIdx.x+threadIdx.y*blockDim.x+threadIdx.z*blockDim.x*blockDim.y。
        8. 對於計算執行緒索引偏移增量為已啟動執行緒的總數。如stride = blockDim.x * gridDim.x; threadId += stride。
函式修飾符

CUDA從入門到精通到精通_筆記5:GPU入門綜述博文

網絡安全工程師視頻教程從入門到精通學習_網絡安全入門教程

pro nes 案例漏洞 tex 掃描文件包含漏洞網絡安全工程師 sql 課程目錄：階段一：信息收集本階段主要是×××測試前期的信息收集，在這個階段我們需要盡可能多的收集目標的信息。01.網絡安全-信息收集專題1.信息收集專題概述2.利用搜索引擎收集信息3.通過目標

《CCF中學生計算機程序設計-入門篇》_例5.23

NOIP 信息學奧賽 C++ #include <bits/stdc++.h>using namespace std;int main(){char s[5];int x=0,y=0,n=0; while((s[n]=getchar())!=‘+‘) { x=x*10+s[n]

誰說菜鳥不會資料分析（入門篇）----- 學習筆記5（資料展現：圖表）

1、圖表作用：表達形象化、突出重點、體現專業化 2、圖示型別： 3、通過關係選擇圖表 4、圖表製作5步法 5、圖表：圖所不能說的話突出單元格顯示：絕對值專案選取：相對值資料條：量綱不同圖示集：企業運營指標發展態勢監控迷你圖

CUDA從入門到精通到精通_筆記1:CUDA程式設計開發環境的配置

(一)安裝環境作業系統:windows7 顯示卡型號:NIVIDA (二)軟體準備 1---VS2010(推薦大家使用VS2010,vs20

unity 5.x從入門到精通讀書筆記（一）

transform 場景 engine class 遊戲 iou 遊戲制作初始化 bsp 《unity 5.x從入門到精通》前四章是一些Unity的情況介紹，第五章開始介紹Unity的基礎操作，第六章通過一個3D場景的實現介紹了3D遊戲制作模式的基本操作。

WebSocket協議：5分鐘從入門到精通

eric tps mis 時間客戶 mozilla doc sin local 一、內容概覽 WebSocket的出現，使得瀏覽器具備了實時雙向通信的能力。本文由淺入深，介紹了WebSocket如何建立連接、交換數據的細節，以及數據幀的格式。此外，還簡要介紹了針對W

【筆記】Java從入門到精通 | 應用篇

png 解決一個數據庫應用最有精通圖片自己歸納下圖簡單歸納了Java的一些應用，包括Swing和AWT設計，打印技術，I/O技術，網絡通信，和數據庫應用。這一方面的學習，最有效的方式就是簡單過一下相關概念和語句，然後在具體項目開發中熟悉。如果自己能參與或負責

安卓學習筆記 -- （安裝環境） Android Studio安裝配置、環境搭建詳細步驟及基本使用 Android Studio和SDK官方開發工具下載 Android Studio教程從入門到精通 Android開發-之第一個程式：HelloWorld！

1、下載Android Studio安裝配置、環境搭建詳細步驟及基本使用 https://www.cnblogs.com/yanglh6-jyx/p/Android_AS_Configuration.html https://blog.csdn.net/k491022087/ar

《Altium Designer 16+14 電路設計與模擬從入門到精通》等5本書+光碟原始檔

資源連結：https://pan.baidu.com/s/1igIBZsrwv0zF75lrZXovGA分享5本與PCB設計相關的經典書籍和相應的光碟檔案：《Altium Designer 16 電路設計與模擬從入門到精通》《Altium Designer 14 電路設計與模擬從入門到精通》《Altium D

《Altium Designer 16+14 電路設計與仿真從入門到精通》等5本書+光盤源文件

src vpd vga proc baidu 實戰 pcb設計 text shadow 資源鏈接：https://pan.baidu.com/s/1igIBZsrwv0zF75lrZXovGA分享5本與PCB設計相關的經典書籍和相應的光盤文件：《Altium Designe

HTML5之全域性屬性（宣告：內容節選自《HTML 5從入門到精通》）

contentEditable ———————————————————————————————————————————————————————— 功能：允許使用者編輯元素中的內容。功能說明：該元素必須是可以獲得滑鼠焦點的元素，而且在點選

bayaim_java_入門到精通_聽課筆記bayaim_20181120

------------------java_入門到精通_聽課筆記bayaim_20181120--------------------------------- Java的三種技術架構: JAVAEE：Java Platform Enterprise Edition，開發企業環境下的應用程式，

組合語言從入門到精通-5微機CPU的指令系統2

微機CPU的指令系統 5.2.2 標誌位操作指令標誌位操作指令是一組對標誌位置位、復位、儲存和恢復等操作的指令。 1、進位CF操作指令 a、清進位指令CLC(Clear Carry Flag)：CF←0b、置進位指令STC(Set Carry Flag)：CF←1c、進位取反指令CMC(Comple

匯編語言從入門到精通-5微機CPU的指令系統2

外部分享圖片復雜微機變化小結 interrupt push 列表微機CPU的指令系統 5.2.2 標誌位操作指令標誌位操作指令是一組對標誌位置位、復位、保存和恢復等操作的指令。 1、進位CF操作指令 a、清進位指令CLC(Clear Carry Flag)：C

Java 從入門到精通（第4版）第5章字串

開始講解之前，先列出本章的提綱，如下圖所示： 5.1 String類 5.1.1 宣告字串 String str; 5.1.2 建立字串 String str1 = new String("student"); System.out.println(str1); char

JavaScript從入門到精通-學習筆記

必須瞭解的JavaScript知識正式名稱ECMAScript JavaScript是一種基於物件和事件驅動並具有安全效能的指令碼語言。目的是與html和java applet一起實現在一個

《Mybatis從入門到精通》讀書筆記（二）

第三章. Mybatis 註解方式的基本用法表字段和Java屬性欄位對映的方式： 1. SQL語句中列取別名 2. 設定mapUnderscoreToCamelCase = true（下劃線轉駝峰） 3. resultMap對映註解方式應用場景不多，不做過多

《Mybatis從入門到精通》讀書筆記（三）

第六章. Mybatis高階查詢在關係型資料庫中，我們經常要處理一對一，一對多的關係。在面對這種關係的時候，我們可能要寫多個方法分別查詢這些資料，然後再組合到一起。這種處理方式特別適合用在大型系統

CUDA從入門到精通到精通_筆記5:GPU入門綜述博文

相關推薦