1. 程式人生 > >CUDA C 最佳實踐:應用程式效能分析【讀書筆記】

CUDA C 最佳實踐:應用程式效能分析【讀書筆記】

以下為長截圖,CSDN 限定了圖片長度,請點選檢視原圖

 

gprof:

 

gprof 支援的選項:

-b 不再輸出統計圖表中每個欄位的詳細描述。

-q 只輸出函式的呼叫圖(Call graph的那部分資訊)。

-p 只輸出函式的時間消耗列表。

-e Name 不再輸出函式Name 及其子函式的呼叫圖(除非它們有未被限制的其它父函式)。可以給定多個 -e 標誌。一個 -e 標誌只能指定一個函式。

-E Name 不再輸出函式Name 及其子函式的呼叫圖,此標誌類似於 -e 標誌,但它在總時間和百分比時間的計算中排除了由函式Name 及其子函式所用的時間。

-f Name 輸出函式Name 及其子函式的呼叫圖。可以指定多個 -f 標誌。一個 -f 標誌只能指定一個函式。

-F Name 輸出函式Name 及其子函式的呼叫圖,它類似於 -f 標誌,但它在總時間和百分比時間計算中僅使用所列印的例程的時間。可以指定多個 -F 標誌。一個 -F 標誌只能指定一個函式。-F 標誌覆蓋 -E 標誌。

-z 顯示使用次數為零的例程(按照呼叫計數和累積時間計算)。

 

延伸閱讀:

Linux下C++ 效能測試工具GPROF()入門教程 

nvcc 官方文件