NVIDIA GeForce RTX 2080 Ti/2080同步評測: 追光十二年
大家期待了兩年的NVIDIA新顯示卡,終於在今天正式解禁了效能評測,中間跳過了Votla架構後,Turing架構橫空出世,帶著圖靈極具革命性的創新思想,全球第一款支援實時光線追蹤的顯示卡RTX 2080 Ti、RTX 2080誕生了。那麼在新架構、新工藝下的Turing圖靈顯示卡將會與光線追蹤迸發出什麼樣的火花?效能上會有怎樣的驚喜?一切都會在這篇同步評測中揭曉。
在過去10年,NVIDIA一直都在堅持使用GeForce GTX作為顯示卡的字首,這一次改名GeForce RTX顯示了他們內心的激動、以及改變遊戲界現狀那種自豪,“R”顯然代表著“Real-Time Ray Tracing(實時光線追蹤)”,代表著NVIDIA過去十年的努力,這一刻終於呈現給了我們的遊戲玩家。
NVIDIA CEO黃仁勳在釋出現場興奮地說,Turing顯示卡是過去12年裡GPU最大的飛躍。
所以,這一代Turing圖靈顯示卡最大亮點就是實現了遊戲畫質飛躍式進步的前提——支援實時光線追蹤,也是最大的亮點。下面是我們針對RTX 2080 Ti、RTX 2080“光追”顯示卡,對比上一代同級Pascal顯示卡的規格對比表。
RTX 2080 Ti、RTX 2080規格:
首先Turing顯示卡最明顯的變化就是,目前是一個核心對應一個型號,TU102是RTX 2080 Ti專屬、TU104為RTX 2080專屬,TU106為RTX 2070專屬,而上一代GTX 2080、GTX 2070共用同一款GP104核心。
Turing顯示卡將會採用12nm FFN工藝打造,技術供應方來自臺積電,12nm FFN其實還是基於16nm FF+演進過來,12nm FFN最後的“N”代表著這是專門為NVIDIA優化的高效能版本。
儘管有了新制程的支援,Turing GPU核心面積也是水漲船高,雖然還沒有達到TITAN V GV100核心那種815mm2級別,但也相差不遠了,RTX 2080 Ti的TU102足足有754mm2,RTX 2080使用的TU104也有545mm2,因此電晶體數量達到了空前的186億、136億,像RTX 2080比起GTX 1080都快翻倍了。
冷靜地分析一下,Turing核心面積暴漲原因其實並不是暴力堆砌CUDA單元結果,而是引入了全新的Tensor Core以及RT Core單元有極大關係。而它們的出現成就了Turing圖靈顯示卡最大亮點——遊戲也可AI、實時光線追蹤不是夢!
TU102核心架構
之前我們都說過三款新顯示卡都有不同的GPU核心,其實它們內部結構都是發生了很大變化。RTX 2080 Ti TU102核心規模真的非常大,TU102核心一共分為6組GPC單元,每組GPC單元又擁有12個SM單元,一共是72個SM單元,但RTX 2080 Ti也只用到其中的68個而已,算下來68×64=4352個CUDA流處理器。同時按照RTX 2080 Ti已經公佈的引數,可以計算得出,每個SM單元將會配備64個CUDA、8個Tensor Core 、1個RT Core,每個SM單元配給64個CUDA的做法,倒像是從前GP100大核心喜歡做的事情,原因會在後面給出。
TU102
TU102核心架構
完整版的TU104核心依然是6組GPC單元,不過每組GPC改為8個SM單元,一共是6×8=48個,而RTX 2080的GPU核心是TU104-400,只用上了46組,還有預留有2組空缺的,46×64=2944個,規模要比RTX 2080 Ti小多了,真怨不得RTX 2080 Ti為什麼貴那麼多。
TU104
頻率方面,RTX 20系列顯示卡頻率還是相對保守,沒有說一來就上2GHz這種可怕設定。但這一次頻率高低出現了微妙的變化,以往Founders Edition版本意味著是最低的基礎頻率,然而在RTX 20系列中,它也預超頻了。RTX 2080 Ti Founders Edition設定在1350MHz,起步看似很低,但boost頻率可達1635MHz,將近300MHz的boost範圍前所未有,Pascal架構顯示卡的基本上都是150MHz以內。RTX 2080 Founders Edition是在1515-1800MHz之間。另外有NVIDIA GPU BOOST 4.0神祕加成,頻率還能更上一層樓!不過我們也擔心,Founders Edition版本預設頻率較高,GPU BOOST 4.0凶殘,12nm FFN非大改工藝,留給玩家的超頻空間依然有限。
浮點效能上,因為涉及到CUDA單元、Tensor Core、RT Core,三者效能差異各不相同,箇中關係也很微妙。就單精度效能而言,RTX 2080居然和GTX 1080 Ti不分伯仲,所以大家就不要說期待RTX 2080吊打GTX 1080 Ti了,不過RTX 2080 Ti是真的強,14.2TLFOPS要比GTX 1080 Ti的10.6TLFPOS高多;由於Pascal架構顯示卡沒有Tensor Core,Tensor INT4這方面算力為0,RTX 2080 Ti、RTX 2080分別為455.4、339.1TOPS;衡量光線追蹤能力的RTX- OPS上,圖靈顯示卡由於有專屬的加速硬體RT Core,RTX 2080 Ti、RTX 2080可以做到78、60 TOPS,而GTX 1080 Ti、GTX 1080只有可憐的11.3、8.9 TOPS。
視訊記憶體方面,顯示器解析度不斷提高、紋理貼圖尺寸更大、渲染技術也越來越複雜、資料互動量非常大、視訊記憶體帶來以及容量大小在影響GPU效能中佔比越來越大,為了解決這些瓶頸,NVIDIA首次採用了GDDR6視訊記憶體。GDDR6繼承了GDDR5X中的16bit預取寬度,使用了改進版的QDR 4倍資料倍率技術,GDD6視訊記憶體速度因此可以拋開GDDR5一大截,而NVIDIA本次在Turing顯示卡上全部採用14Gbps版本。GDDR6好處顯然易見,那就是視訊記憶體頻寬的直線上升,就是為了滿足實時光線追蹤大量資料交換。舉個例子,GTX 1080 Ti 11GB 11Gbps的GDDR5X視訊記憶體頻寬才484GB/s,RTX 2070 8GB 14Gbps的GDDR6視訊記憶體頻寬就有484GB/s,RTX 2080 Ti就更厲害了,頻寬都虐了HBM 2,難怪NVIDIA不願意用HBM 2視訊記憶體,GDDR6優勢明顯了。
功耗方面,從Maxwell、Pascal架構開始,NVIDIA開始對顯示卡功耗進行大刀闊斧地進行改革,一直在給功耗做減法。但Turing架構就沒辦法了,因為Tensor Core、RT Core的加入,引入了大量額外的電晶體,功耗只能漲了,RTX 2080 Ti Founders Edition是260W,略高於GTX 1080 Ti的250W,需要8+8Pin外接供電;RTX 2080就漲得更多了,需要250W,而上一代同級GTX 1080只要180W,因此供電介面也改為了6+8 Pin。
顯示介面方面,I/O介面一直都在不斷小型化,臃腫的介面都會面臨淘汰的一天,VGA是這樣,這一次輪到DVI了,僅保留一個HDMI 2.0b、三個DisplayPort 1.4介面,以及一個新上位的USB Type-C視訊輸出介面。USB Type-C只是介面形式,內部其實還是走DisplayPort 1.4協議,最高支援8K解析度。它不僅僅充當視訊輸出介面,還能傳輸資料、充電!那就是之前由微軟、英偉達、AMD、Oculus、Valve牽頭制定的VirtualLink,可以走DisplayPort HBR3協議、USB 3.1 Gen2 (10Gbps)、最高27W供電。能夠簡化虛擬現實裝置的調校準備,比方說HTC Vive本身就需要HDMI、USB 3.0、電源多種線纜,現在一根USB Type -C就搞定了。
價格方面,NVIDIA一直在鼓吹的消費升級,在RTX 20系列顯示卡中得到了具體體現,RTX 2080 Ti售價已經高達8199元(Founders Edition 9999元),GTX 1080 Ti當初售價不過是5699元,漲幅43%,真的是可怕。RTX 2080也漲到5699元起步,而GTX 1080發售之初只要4599元。可以預期,萬元顯示卡已經成為了新常態。