1. 程式人生 > >GPU編程中UMA的作用及限制

GPU編程中UMA的作用及限制

pci 結果 處理 時間 同步 tile 由於 訪問速度 如果

1. UMA和hUMA

傳統的UMA由於CPU和GPU各自cache的獨立性,如果不能很好的處理cache同步,那麽輕則訪問速度變慢,重則數據出錯。AMD提出的hUMA解決了這一問題,保證了cache層的數據一致性

2. UMA的限制

  • UMA不解決讀回的速度慢的問題。讀回渲染結果的三件事情:同步->拷貝->untile。由於PCIe是對稱的,所以重點問題一般出在同步上。
  • UMA不能顯著地提升性能。如前所述,在硬件支持hUMA且可以渲染untile數據的前提下才能節省拷貝的時間,即便如此,拷貝所占時間很少,所以不能顯著提升性能

GPU編程中UMA的作用及限制