1. 程式人生 > >CUDA最佳實踐(一)

CUDA最佳實踐(一)

對於Gustafson定律,我們可以這樣理解:在弱標度的情形下,問題規模並不是恆定的,總執行時間才是恆定的。設序列執行的總時間為T,每個處理器處理耗時為t,那麼單處理器序列執行時需要T/t個處理器時間,將處理器數量增加到N,這時部分程式碼由於並行化的緣故是可以重疊執行的,在t時間中,相當於完成了序列執行時PNt + (1 - P)t時間的任務,此時執行總時間為T / (PNt + (1 - P)t),將序列執行時間與N處理器並行執行時間相比,得到加速比為:S = PN + 1 - P,也就是Gustafson定律括號展開後得到的結果。