C++和cuda C的結合發揮各自的優點

阿新 • • 發佈：2018-11-13

本次實驗主要是實現vector複製到cuda中，一般教材上都是使用指標，很是繁瑣，而且STL優秀的演算法不太容易使用。為了實現C++ STL的優秀演算法和cuda的平行計算能力，二設計的本次實驗。

一下程式碼僅供提供思路。

#include <cuda_runtime.h>
#include <iostream>
#include <vector>
#include <algorithm>
#define DATATYPE float
__global__ void vector_add_gpu_1(DATATYPE *a,DATATYPE *b,DATATYPE *c,int n)
{
    for(int i = 0; i < n; ++i)
    {
        c[i] = a[i] + b[i];
    }
}

int main()
{
    int n;
    std::cout << "請輸入數字" << std::endl;
    std::cin >> n;
    DATATYPE *d_a,*d_b,*d_c,*h_c;
    h_c = (float*)malloc(n*sizeof(float));
    std::vector<DATATYPE> h_a;
    std::vector<DATATYPE> h_b;

    std::cout << "正在賦值" << std::endl;
    for(int i = 0;i < n;++i)
    {
        h_a.push_back(i);
        h_b.push_back(i);

        std::cout << "h_a[" << i << "] = " << h_a[i] << "\t";
        std::cout << "h_b[" << i << "] = " << h_b[i] << "\t";
    }

    std::cout << std::endl;
    std::cout << "GPU運算中" << std::endl;
    cudaMalloc((void**)&d_a,sizeof(DATATYPE) * n);
    cudaMalloc((void**)&d_b,sizeof(DATATYPE) * n);
    cudaMalloc((void**)&d_c,sizeof(DATATYPE) * n);

    cudaMemcpy(d_a,&h_a[0],sizeof(DATATYPE) * n,cudaMemcpyHostToDevice);
    cudaMemcpy(d_b,&h_b[0],sizeof(DATATYPE) * n,cudaMemcpyHostToDevice);

    vector_add_gpu_1<<<1,1>>>(d_a,d_b,d_c,n);

    cudaMemcpy(h_c,d_c,sizeof(DATATYPE) * n,cudaMemcpyDeviceToHost);

    cudaFree(d_a);
    cudaFree(d_b);
    cudaFree(d_c);
    std::cout << "運算完成，輸出。" << std::endl;
    for(int i = 0;i < n;++i)
    {
         std::cout << "h_c[" << i << "] = " << h_c[i] << std::endl;
    }
    return 0;
}

C++和cuda C的結合發揮各自的優點

本次實驗主要是實現vector複製到cuda中，一般教材上都是使用指標，很是繁瑣，而且STL優秀的演算法不太容易使用。為了實現C++ STL的優秀演算法和cuda的平行計算能力，二設計的本次實驗。一下程式碼僅供提供思路。 #include <cuda_runtime.h&

c++和cuda混合編程實現傳統神經網絡

fin ice 很慢 break 運行時 txt ads pre gsp 直接放代碼了。。。實現的是x1+x2=y的預測，但梯度下降很慢。。。233333，gpu運行時間很快！！ // // main.cpp // bp // // Created by jzc

c++和cuda混合程式設計記錄二

/////帶有繼承關係的記憶體分配遇到了問題，父類，子類 sphere *world_device; cudaMalloc( (void**)&world_device,s

從彙編和底層的角度看c和類c語言

從彙編和底層的角度看c和類c語言寫這篇文章的目的是對近期底層學習的總結，也算是勉勵自己吧，畢竟是光靠興趣苦逼自學不是自己專業的東西要承受很多壓力。 https://blog.csdn.net/jggyyhh/article/details

Microsoft Visual C 和 Borland C Builder 之比較

來源：百度（最原始的地方未知，我大概整理了一下格式）。本文就試圖從技術水平、易用性、穩定性、發展前景等對Visual C++和C++Builder(Delphi)這兩個重量級開發工具進行比較分析。由於Delphi

linux核心中GNU C和標準C的區別

今天看了一下午的linux核心程式設計方面的內容，發現linux 核心中GNU C與標準C有一些差別，特記錄如下： linux 系統上可用的C編譯器是GNU C編譯器，它建立在自由軟體基金會的程式設計許可證的基礎上，因此可以自由釋出。GNU　C對標準C進行進一步擴充套件，以增強標準C的功能。下面我們對GNU

char *c和char c[]區別

函式中的下一條指令，程式由該點繼續執行。堆：一般是在堆的頭部用一個位元組存放堆的大小。堆中的具體內容由程式設計師安排。 2.6存取效率的比較char s1[]="aaaaaaaaaaaaaaa"; char *s2="bbbbbbbbbbbbbbbbb"; aaaaaaaaaaa是在執行時刻賦值的；而bb

【C#】C#委託和字典的結合使用

using System.Collections; using System.Collections.Generic; using UnityEngine; public class DelegateDic : MonoBehaviour { public de

關於影象的二維卷積各種版本的實現（C++，Cuda和mex）

　　卷積的相關知識本文不再描述，網上大把的資源，本文給出二維卷積的各種版本的實現。　　 C++版本　　首先是最常用的C++版本的卷積實現，程式碼如下： void Conv2(int**

C#委託和字典的結合使用

目錄例1：例2：例1： class Program { static void Main(string[] args) { Dictionary<char, Func<

Python:通過執行100萬次列印來比較C和python的效能，以及用C和python結合來解決效能問題的方法

python作為動態語言，開發效率相當高，但如我們所知，動態語言的執行效率往往是比較低的，請看下面簡單的測試過程：一、 C語言實現100萬次列印：程式碼： #include<stdio.h> #include <time.h> int

深入剖析C函式引數的結合順序及a++和++a的區別

C語言函式引數的結合順序今天上課時老師提出了一個關於C語言的函式引數的結合順序的問題以及a++和++a有什麼區別的問題，為了弄清楚這個問題，我寫了如下的程式碼反彙編進行分析： #include <stdio.h> #include <

學習日記之享元模式和Effective C++

實例存儲通過由於類型 ati 擦除 -s 當前享元模式（Flyweight）：運用共享技術有效地支持大量細粒度的對象。（1），享元模式能夠避免大量很相似的開銷。在程序設計中，有時須要生成大量細粒度的類實例來表示數據。假設能發現這些實例除了幾個參數外基本上都是

WebViewJavascriptBridge－Obj-C和JavaScript互通消息的橋梁

ref 靜態反饋 new mar ati port ces bridge 本文翻譯自Marcus Westin的開源框架WebViewJavascriptBridge的readme,英文原文鏈接https://github.com/marcuswestin/WebV

Swift和Objective-C混合編程——Swift調用OC

分享發現 load 另一個 == 方法代碼 swift 應用在iOS應用的開發中。Swift必將代替OC，兩者的趨勢是“短期共存，長期代替”。但曾經有太多的代碼是用OC語言完畢的，而Swift的開發也從 OC中繼承了非常多的特性。兩者也是有非常多的類

淺析c++和c語言的enum類型

gre gree 但是最大 src 淺析 end cnblogs () 1.先看c語言枚舉類型 1.c語言定義枚舉類型,每一個枚舉元素都是一個整數2.註重數據類型，沒有數據類型限定3.相鄰枚舉元素相差整數4.可以通過整數訪問，不夠安全 2.上代碼： 1 #includ

C和C++頭文件大全

文件關於 limit stack 運算符動態數學函數 limits pan C、傳統 C++ #include <assert.h>　　　　//設定插入點#include <ctype.h>　　　　 //字符處理#include <er

Swift 4 和 Objective-C 混合編程（一）快速起步

命名方式 import 編譯器選擇性工程 Swift 4 和 Objective-C 在同一個工程裏的混搭編程的方法你可以在 xcode 裏同時使用 Swift 和 Objective-C（以下簡稱OC）來寫代碼，混搭編程的好處很多，比如允許大量代碼的復用，在性能和開發效率之間找到平衡

C、C++和Java，AIHDOI

c++和java ++ 安全思維方式編譯繼承編程語言健壯性包含 C語言是一門通用計算機編程語言，應用廣泛。C語言的設計目標是提供一種能以簡易的方式編譯、處理低級存儲器、產生少量的機器碼以及不需要任何運行環境支持便能運行的編程語言。盡管C語言提供了許多低級處理

C++和QML混合的QT程序調試方法

cti 卡死 xxx 按鈕 conn 應用混合簡單 config 以前調試只是QML或者只是C++的QT程序很簡單，斷點打上，直接debug按鈕一點，喝一口水，自然就停在斷點了。這次遇到C++和QML混合的程序，把CONFIG+=declarative_debugCO

C++和cuda C的結合發揮各自的優點

相關推薦