1. 程式人生 > >CUDA硬體實現分析(一)------安營紮寨-----GPU的革命

CUDA硬體實現分析(一)------安營紮寨-----GPU的革命

空洞的講解或許還是沒怎麼又說服力,下面以G80為例子。
1. G80
裡面有16Multiprocessor.
2.
每個Multiprocessor都有一組(G80裡面是8個)32位的Processor(每個Processor都是SIMD架構,什麼叫SIMD架構:軍訓的時候,大家都到了食堂,不是像在學校裡面,每個人那自己的碗筷就三三倆倆的去吃飯,那可要講究紀律,啥叫紀律,一群人站在桌子面前,連長沒發話,誰也不敢坐下來……連長一聲令下:“坐下”。所有的人才按照敢坐下來,也是同時坐下來- -!要是誰沒有同步坐下來,那就慘了- -!再來一次,一定要是同步坐下去的,都能聽到聲的,咵!恨不得把板凳給坐碎了------
還是部隊的東西結實,兄弟們怎麼坐到軍訓結束只有坐壞屁股的,沒有聽說凳子坐壞的- -!所以啊,愛惜公物就是愛惜自己。記住了吧,這就是SIMDSingle Instruction Multiple Data )還有共用的Instruction Unit(這玩兒就不用翻譯是啥了吧~看SIMD,自己理解去)。在G80裡面有兩個SFU模組。
3.
每一個時鐘週期內,按照warp(這玩兒咋翻譯啦?就理解為執行的時候,一個block裡面一起執行的thread,例如block裡面有512thread,但是每次只有32thread在執行,那麼這32thread就是一個執行的warp- -! 還好不是rap- -
!俺就真沒法解釋了)
4.
每一個warp裡面包含的thread數量是有限的,現在的規定是32個。將來不知道會不會有變化?不知道,這個只有CUDA開發人員知道了。