MATLAB上的GPU加速計算——學習筆記 (2014-12-22 04:44:05)

阿新 • • 發佈：2018-11-03

轉自：http://blog.sina.com.cn/s/blog_6f062c360102v9ic.html

MATLAB可謂工程計算中的神器，一方面它自帶豐富的函式庫，另一方面它所有的資料都是內建的矩陣型別，最後畫圖也方便，因此解決一些小規模的計算問題如果對效能要求不高的話開發效率遠大於C++ FORTRAN之類傳統手段。不過受限於PC的計算能力，對於一些大規模資料處理它就力不從心了。還好最近Matlab開發了cuda的wrapper，計算能力因而上升了一個數量級。

那麼怎樣在MATLAB上做GPU計算呢?

首先要進行資料的初始化。有兩種方法可以進行初始化：一是先在CPU上設定好資料然後拷貝到GPU；二是直接在GPU上初始化資料。先看看第一種方案：

N = 6;

M = magic(N);

G = gpuArray(M);

可見把資料從CPU拷貝到GPU上非常簡單，只要B = gpuArray (A)就可以了。實際上MATLAB並沒有規定一個矩陣定義之後不能改型別，所以以下也是可以的：

M = gpuArray(M);

有時候GPU受限於硬體架構，單精度的計算遠快於雙精度。這時候可以考慮在拷貝的時候順便轉換一下精度：

A = gpuArray(single(B));

如前所述，第二種方法是直接在GPU上設定資料：

A = zeros(10, 'gpuArray');

這時候執行size函式：

size (A)

得到 100 100。所以A其實是一個二維陣列。

也可以生成一個一維的隨機陣列：

r = gpuArray.rand(1, 100) % 一行，一百列

執行class函式：

class(r)

得到

ans = gpuArray。可見這是一個在gpu上的陣列。

下面就是對GPU資料進行操作。首先，MATLAB定義了GPU上豐富的庫函式，比如快速傅立葉變換：

result = fft(r)

這樣result就是另一個GPU上的陣列，儲存了對r做fft的結果。

加減乘除更不在話下：

r2 = (real(result) + r ) / 2

作用是對result取實部之後加r再除以2.這裡r2, r, result都是GPU上的陣列。方便吧？

最後是如何把GPU上的資料回傳給CPU:

B = gather (A);

其中A是GPU上的資料，B是CPU上的資料。B的內容在回傳之後等於A。

並不是所有的電腦都可以用MATLAB進行GPU加速計算。想知道自己的電腦有沒有這個能力，執行gpuDevice:

>> gpuDevice

ans =

CUDADevice with properties:

Name: 'GeForce GTX 650'

Index: 1

ComputeCapability: '3.0'

SupportsDouble: 1

DriverVersion: 6.5000

ToolkitVersion: 5

MaxThreadsPerBlock: 1024

MaxShmemPerBlock: 49152

MaxThreadBlockSize: [1024 1024 64]

MaxGridSize: [2.1475e+09 65535 65535]

SIMDWidth: 32

TotalMemory: 1.0737e+09

FreeMemory: 732377088

MultiprocessorCount: 2

ClockRateKHz: 1058500

ComputeMode: 'Default'

GPUOverlapsTransfers: 1

KernelExecutionTimeout: 1

CanMapHostMemory: 1

DeviceSupported: 1

DeviceSelected: 1

MATLAB目前只支援Nvidia的顯示卡。如果你的顯示卡是AMD的或者是Intel的，就得考慮另尋它路了。

MATLAB上的GPU加速計算——學習筆記 (2014-12-22 04:44:05)

轉自：http://blog.sina.com.cn/s/blog_6f062c360102v9ic.html MATLAB可謂工程計算中的神器，一方面它自帶豐富的函式庫，另一方面它所有的資料都是內建的矩陣型別，最後畫圖也方便，因此解決一些小規模的計算問題如果對效能要求不高的話

MATLAB上的GPU加速計算

【時間】2018.10.12 【題目】MATLAB上的GPU加速計算概述怎樣在MATLAB上做GPU計算呢?主要分為三個步驟：資料的初始化、對GPU資料進行操作、把GPU上的資料回傳給CPU 一、資料的初始化首先要進行資料的初始化。有兩種

MATLAB數字圖像處理學習筆記

.html blog mage file png tle src 大於 span 　　我們都知道一幅圖片就相當於一個二維數組，可以用一個矩陣來表示，而MATLAB可以說就是為矩陣運算而生的，所以學習圖像處理，學習MATLAB勢在必行！一、 MATLAB基礎知識 1.

雲計算學習筆記，雲計算Python自動化基本用法

雲計算學習筆記Python編程博大精深，知識點眾多，需要先整體上了解python的一些基本用法之後再去對每一個知識點細細研究，這樣學習的速度會快很多。所以下面就先看一些python事先需要知道的基本知識。行和縮進：學習Python時，遇到的第一個需要註意的地方是，不使用括號來表示代碼的類和函數定義塊或流程

車聯網上雲最佳實踐學習筆記

簡介這是阿里雲棲出的總監直播課中的一個系列，抽時間學完了，並稍帶做了一個腦圖，這樣後來的同學們就可以快速學習這個直播系列所講的內容了。擴充套件學習內容：本課程對應電子書下載地址直播視訊第一課的地址腦圖檔案的原始地址如果下面的腦

PFC電源設計與電感設計計算學習筆記

增加反壓廣泛流控 rec 是不是明顯開始脈沖 PFC電源設計與電感設計計算更新於2018-11-30 課程概覽常見PFC電路和特點1 常見PFC電路和特點1 CRM PFC電路設計計算 CCM PFC電路設計計算 CCM Interleave PFC電感紋

內建資料型別（上）---Python基礎學習筆記（四）

內建資料的三大主要型別： 1、數字（整數、浮點數） 2、序列（字串、列表、元組） 3、對映（字典）按照是否可原地修改值分兩大類：不可變物件（數字，字串，元組，不可變集合）可變物件（列表，字典，可變集合）一、整數（不

Matlab 應用GPU加速

由於GPU近幾年地迅速發展，GPU在多執行緒計算等方面逐漸超越CPU成為計算的主力軍。而Matlab是常用的數學應用軟體，現在講解一下如何在Matlab中使用GPU加速計算 0. 必要條件要想在Matlab中使用GPU加速有兩個必須的條件計算機上

雲端計算學習筆記002---雲端計算的理解及介紹,google雲端計算平臺實現原理

什麼是雲端計算： l 說的明白一點： • 雲端計算其實就更大限度的發揮網路的資源。 • 那為什麼叫雲，為什麼不到網際網路計算？Cloud l 大多數計算的網路拓撲圖都用一塊“雲”來表示網際網路。於是就形成了雲端計算的說法 l 狹義：是指IT基礎設施的交付和

mxnet：結合R與GPU加速深度學習

轉載於統計之都，http://cos.name/tag/dmlc/，作者陳天奇————————————————————————————————————————————————————————————Matt︱R語言呼叫深度學習架構系列引文近年來，深度學習可謂是機器學習方向的明

雲端計算學習筆記（二）：雲端計算機制

一些術語和概念邏輯網路邊界（logical network perimeter）通常是由提供和控制資料中心連線的網路裝置建立，例如虛擬防火牆，虛擬網路（VLAN、VPN）虛擬伺服器（VM），虛擬基礎設施管理器（VIM，虛擬基礎設施管理器，用於協調與VM例項建立相關的物理伺服器）雲存貯裝置：cloud

GPU加速計算-工具介紹

　　主要在R下和Python下使用GPU加速計算，使用成熟的工具來提高自己的工作效率，現在對其中一些方法做一下簡單總結。 R的GPU加速計算包gputools 　　1）gputools，R下的GPU加速計算的函式包，包含常見的運算操作。　　https:/

用GPU加速深度學習: Windows安裝CUDA+TensorFlow教程

***根據讀者反饋，Python 3.6可用*** ***軟體安裝有時效性，如果安裝失敗請參考評論區反饋*** ***請勿私信問我為什麼“XXX安裝失敗”，我也不知道*** ***精力有限，本文不再繼續更新*** 0.背景在的Windows上使用GPU進行深度學習

雲端計算學習筆記（一）：雲端計算基礎

本系列將對雲端計算進行學習，目前資料來自《雲端計算-概念、技術與架構》（第一作者：Tomas Erl）一書。目的是將書讀薄。這本書看了第一部分，翻譯怎麼說呢，偶碰網路上的詞不準確（極個別，不影響），可能是老師找學生翻譯的。語言有些生硬，譯者可能忠實原文，一對一進行了直譯，所有讀起來覺得不是中國人在說話，有

《機器學習》筆記-計算學習理論（12）

作者：劉才權編輯：李雪冬前言如今機器學習和深度

圖計算-----學習筆記

特點：資料關聯性強；常常表現出比較差的記憶體訪問區域性性針對單個頂點的處理工作過少計算過程中伴隨著並行度的改變大型圖計算主要包括兩種：基於遍歷演算法的、實時的圖資料庫，如Neo4j、OrientDB、DEX和 Infinite Graph；以圖頂點為中心的、基於訊息傳遞批處理

矩陣加速數列(學習筆記)

span urn www define str problem 需要 struct printf 當我們遇到這樣一類問題:已知遞推式,但數據範圍太大,直接遞推下去肯定會超時,例如求斐波拉契數列的第n項(\(n<=10^{18}\))等等.這是我們就需要用到矩陣來加速遞

Java程序猿的JavaScript學習筆記（12——jQuery-擴展選擇器）

type write number article mat 我們 content ace val 計劃按例如以下順序完畢這篇筆記： Java程序猿的JavaScript學習筆記（1——理念） Java程序猿的JavaScript學習筆記（2——屬性復制和繼承） Jav

<<Python基礎教程>>學習筆記 | 第12章 | 圖形用戶界面

lena text 平臺 post ack 由於 contents exp 一個 Python支持的工具包非常多。但沒有一個被覺得標準的工具包。用戶選擇的自由度大些.本章主要介紹最成熟的跨平臺工具包wxPython.官方文檔: http://wxpython.org/

C#學習筆記（12）——三種方法操作XML

結點記得 ext 應用程序 eval 資源特性 pla cells 說明（2017-7-11 16:56:13）：原文地址： C#中常用的幾種讀取XML文件的方法 XML文件是一種常用的文件格式，例如WinForm裏面的app.config以及Web程序中的web.c

MATLAB上的GPU加速計算——學習筆記 (2014-12-22 04:44:05)

相關推薦