1. 程式人生 > >一篇文章搞懂到底什麼是渲染流水線

一篇文章搞懂到底什麼是渲染流水線

本文實際上是《Unity Shader入門精要》一書的讀書筆記,書中關於渲染流水線的講解清楚易懂,非常適合作為Shader學習的入門書籍。自知好記性不如爛筆頭,遂將相關內容再結合自己的一些理解寫作這篇部落格記錄下來。 我們將影象繪製的流程稱為渲染流水線,是由CPU和GPU協作完成的。一般一個渲染流程可以分成3個概念階段,分別是:應用階段(Application Stage),幾何階段(Geometry Stage),光柵化階段(Rasterizer Stage)。 ### 應用階段 應用階段是在CPU中進行的,主要任務是準備好場景資料,設定好渲染狀態,然後輸出渲染圖元,即為下一階段提供所需的幾何資訊。什麼是圖元?圖元是指渲染的基本圖形,通俗來講圖元可以是頂點,線段,三角面等,複雜的圖形可以通過渲染多個三角形來實現。 應用階段可細分為3個子階段 1. 把資料載入到視訊記憶體中。所有渲染所需的資料都需要從硬碟載入到系統記憶體中(RAM),然後網格和紋理等資料又被載入到視訊記憶體(VRAM)。這是因為顯示卡對於視訊記憶體的訪問速度更快,而且大多數顯示卡對於RAM沒有直接的訪問權利。 2. 設定渲染狀態。比如設定使用的著色器,材質,紋理,光源屬性等。 3. 呼叫Draw Call。Draw Call就是一個命令,它的發起方是CPU,接收方是GPU。這個命令僅僅會指向一個需要被渲染的圖元列表,而不會再包含任何材質資訊,這是因為我們已經在上一個階段設定過了。當給定了一個Draw Call時,GPU就會根據渲染狀態和所有輸入的頂點資料來進行計算,最終輸出成螢幕上顯示的那些漂亮的畫素。 ### 幾何階段 幾何階段是在GPU上進行的,主要任務是輸出螢幕空間的頂點資訊。幾何階段用於處理從上一階段接收到的待繪製物體的幾何資料(可以理解為Draw Call指向的圖元列表),與每個渲染圖元打交道,進行逐頂點,逐多邊形的操作。幾何階段的一個重要任務就是把頂點座標變換到螢幕空間中,再交給光柵化器進行處理。通過對輸入的圖元進行多步處理後,這一階段將會輸出螢幕空間的二維頂點座標,每個頂點對應的深度值,著色等相關資訊。 ### 光柵化階段 這一階段也是在GPU上執行的,將會使用上個階段傳遞的資料來產生螢幕上的畫素,並輸出最終的影象。光柵化的任務主要是決定每個渲染圖元中的哪些畫素應該被繪製在螢幕上。它需要對上一個階段得到的逐頂點資料(例如紋理座標,頂點顏色等)進行插值,然後再進行逐畫素處理。可以這樣理解,幾何階段只是得到了圖元頂點的相關資訊,例如對於三角形圖元,得到的就是三個頂點的座標和顏色資訊等。而光柵化階段要做的就是根據這三個頂點,計算出這個三角形覆蓋了哪些畫素,併為這些畫素通過插值計算出它們的顏色。 ### GPU渲染流水線(幾何階段和光柵化階段) ![](https://img2020.cnblogs.com/blog/1673734/202003/1673734-20200318092543662-871247131.jpg) 綠色表示完全可程式設計控制,黃色表示可配置,藍色表示由GPU固定實現,不可修改。實線表示必須由開發者程式設計實現,虛線表示該Shader是可選的。下面我們將分別介紹上圖中的主要子階段。 (順便提一下,曲面細分著色器可用於細分圖元,例如將三角面細分成更小的三角面來新增幾何細節。幾何著色器可決定輸出的圖元型別和個數,當輸出的圖元減少時,實際上起到了裁剪的作用,當輸出的圖元增多或型別改變時,起到了產生或改變圖元的作用) #### 頂點著色器 頂點著色器的處理單位是頂點,輸入進來的每個頂點都會呼叫一次頂點著色器。頂點著色器本身不可以建立或者銷燬任何頂點,而且無法得到頂點和頂點之間的關係,例如我們無法得知兩個頂點是否屬於同一個三角網格。但正因為這樣的相互獨立性,GPU可以利用本身的特性並行化處理每一個頂點,這意味著這一階段的處理速度會很快。 頂點著色器完成的工作主要有:座標變換和逐頂點光照。 ![](https://img2020.cnblogs.com/blog/1673734/202003/1673734-20200318092559572-404085314.gif) 頂點著色器必須進行頂點的座標變換,需要時還可以計算和輸出頂點的顏色。例如我們可能需要進行逐頂點的光照。 座標變換,就是對頂點的座標進行某種變換。頂點著色器可以在這一步中改變頂點的位置,這在頂點動畫中是非常有用的。無論我們在頂點著色器中怎樣改變頂點的位置,一個基本的頂點著色器必須要完成的一個工作是,把頂點座標從模型空間轉換到齊次裁剪空間。 ![](https://img2020.cnblogs.com/blog/1673734/202003/1673734-20200318092625120-633388480.gif) 把頂點座標轉換到齊次裁剪空間後,接著通常再由硬體做透視除法,最終得到歸一化的裝置座標(NDC)。 #### 裁剪 裁剪階段的目的是將那些不在攝像機視野內的頂點裁減掉,並剔除某些三角圖元的面片(面片通常是由一個一個更小的圖元來構成的)。 一個圖元和攝像機視野的關係有3種:完全在視野內,部分在視野內,完全在視野外。完全在視野內的圖元就繼續傳遞給下一個流水線階段,完全在視野外的圖元不會繼續向下傳遞,因為它們不需要被渲染。而那些部分在視野內的圖元需要被裁剪。例如,一條線段的頂點在視野內,而另一個頂點不在視野內,那麼在視野外部的頂點應該使用一個新的頂點來代替,這個新的頂點位於這條線段和視野邊界的交點處。 ![](https://img2020.cnblogs.com/blog/1673734/202003/1673734-20200318092640875-1803315867.gif) #### 螢幕對映 這一步輸入的座標仍然是三維座標系下的座標(範圍在單位立方體內)。螢幕對映的任務是把每個圖元的x和y座標轉換到螢幕座標系下,這實際上是一個縮放的過程。螢幕座標系是一個二維座標系,它和我們用於顯示畫面的解析度有很大關係。 ![](https://img2020.cnblogs.com/blog/1673734/202003/1673734-20200318092654720-96769235.gif) 螢幕對映得到的螢幕座標決定了這個頂點對應螢幕上哪個畫素以及距離這個畫素有多遠。 螢幕對映不會對輸入的z座標做任何處理。實際上,螢幕座標系和z座標一起構成了視窗座標系。這些值會被一起傳遞到光柵化階段。 #### 三角形設定 這個階段會計算光柵化一個三角網格所需的資訊。具體來說,上一個階段輸出的都是三角網格的頂點,但如果要得到整個三角網格對畫素的覆蓋情況,我們就必須計算每條邊上的畫素座標。為了能夠計算邊界畫素的座標資訊,我們就需要得到三角形邊界的表示方式。這樣一個計算三角網格表示資料的過程就叫做三角形設定。它的輸出是為了給下一個階段做準備。 #### 三角形遍歷 三角形遍歷階段將會檢查每個畫素是否被一個三角網格所覆蓋。如果被覆蓋的話,就會生成一個片元。而這樣一個找到哪些畫素被三角網格覆蓋的過程就是三角形遍歷,這個階段也被稱為掃描變換。 三角形遍歷階段會根據上一個階段的計算結果來判斷一個三角網格覆蓋了哪些畫素,並使用三角網格3個頂點的頂點資訊對整個覆蓋區域的畫素進行插值。畫素和片元是一一對應的,每個畫素都會生成一個片元,片元中的狀態記錄了對應畫素的資訊,是對三個頂點的資訊進行插值得到的。 ![](https://img2020.cnblogs.com/blog/1673734/202003/1673734-20200318092712773-2015820168.gif) 這一步的輸出就是得到一個片元序列。需要注意的是一個片元並不是真正意義上的畫素,而是包含了很多狀態的集合,這些狀態用於計算每個畫素的最終顏色。這些狀態包括了但不限於它的螢幕座標,深度資訊,以及其他從幾何階段輸出的頂點資訊,例如法線,紋理座標等。 #### 片元著色器 片元著色器用於實現逐片元的著色操作,輸出是一個或者多個顏色值(即計算該片元對應畫素的顏色,但不是最終顏色)。這一階段可以完成很多重要的渲染技術,其中最重要的技術之一就是紋理取樣。為了在片元著色器中進行紋理取樣,我們通常會在頂點著色器階段輸出每個頂點對應的紋理座標,然後經過光柵化階段對三角網格的3個頂點對應的紋理座標進行插值後,就可以得到其覆蓋的片元的紋理座標了。 ![](https://img2020.cnblogs.com/blog/1673734/202003/1673734-20200318092744307-936607025.gif) 根據上一步插值後的片元資訊,片元著色器計算該片元的輸出顏色 雖然片元著色器可以完成很多重要效果,但它的侷限在於,它僅可以影響單個片元。也就是說,當執行片元著色器時,它不可以將自己的任何結果直接傳送給它的鄰居們。當然導數資訊例外。 #### 逐片元操作 逐片元操作階段負責執行很多重要的操作,例如修改顏色,深度緩衝,進行混合等。 這一階段有幾個主要任務 1. 決定每個片元的可見性。這涉及了很多測試工作,例如深度測試,模板測試等。 2. 如果一個片元通過了所有的測試,就需要把這個片元的顏色值和已經儲存在顏色緩衝區中的顏色進行合併,或者說是混合。 ![](https://img2020.cnblogs.com/blog/1673734/202003/1673734-20200318092802069-792641491.gif) 一個片元,只有通過了所有的測試後,才能和顏色緩衝區中已經存在的畫素顏色進行混合,最後再寫入顏色緩衝區。 ![](https://img2020.cnblogs.com/blog/1673734/202003/1673734-20200318092834584-742346806.gif) ##### 模板測試 模板測試,可以作為一種丟棄片元的輔助方法,與之相關的是模板緩衝。如果開啟了模板測試,GPU會首先讀取(使用讀取掩碼)模板緩衝區中該片元位置的模板值,然後將該值和讀取到(使用讀取掩碼)的參考值進行比較,這個比較函式可以是由開發者指定的,例如小於時捨棄該片元,或者大於等於時捨棄。如果這個片元沒有通過這個測試,該片元就會被捨棄。不管一個片元有沒有通過模板測試,我們都可以根據模板測試和下面的深度測試結果來修改模板緩衝區,這個修改操作也是由開發者指定的。開發者可以設定不同結果下的修改操作,例如,在失敗時模板緩衝區保持不變,通過時將模板緩衝區中對應位置的值加1等。模板測試通常用於限制渲染的區域。另外模板測試還有一些更高階的用法,如渲染陰影,輪廓渲染等。 ##### 深度測試 如果開啟了深度測試,GPU會把該片元的深度值和已經存在於深度緩衝區中的深度值進行比較。這個比較函式也是由開發者設定的。通常如果這個片元的深度值大於等於當前深度緩衝區中的值,那麼就會捨棄它。因為我們總想只顯示出離攝像機最近的物體,而那些被其他物體遮擋的就不需要出現在螢幕上。如果這個片元沒有通過這個測試,該片元就會被捨棄。和模板測試不同的是,如果一個片元沒有通過深度測試,它就沒有權利更改深度緩衝區中的值。而如果它通過了測試,開發者還可以指定是否要用這個片元的深度值覆蓋掉原有的深度值,這是通過開啟/關閉深度寫入來做到的。 ##### 混合 為什麼需要混合?渲染過程是一個物體接著一個物體畫到螢幕上的。而每個畫素的顏色資訊被儲存在一個名為顏色緩衝的地方。因此,當我們執行這次渲染時,顏色緩衝中往往已經有了上次渲染之後的顏色結果,那麼我們是使用這次渲染得到的顏色完全覆蓋掉之前的結果,還是進行其他處理?這就是混合需要解決的問題。 對於不透明物體,開發者可以關閉混合操作。但對於不透明物體,我們就需要使用混合操作來讓這個物體看起來是透明的。 ![](https://img2020.cnblogs.com/blog/1673734/202003/1673734-20200318092845363-930726001.gif) 使用混合函式來進行混合操作。混合函式通常和透明通道息息相關,例如根據透明通道的值進行相加,相減,相乘等。 需要注意的是,上面給出的測試順序並不是唯一的,對於大多數GPU來說,它們會盡可能在執行片元著色器之前就進行這些測試。但是,如果將這些測試提前的話,其檢驗結果可能會與片元著色器中的一些操作衝突。例如,如果我們在片元著色器進行了透明度測試,而這個片元沒有通過透明度測試,我們會通過呼叫API來手動將其捨棄掉。這就導致GPU無法提前執行各種操作。因此現代的GPU會判斷片元著色器中的操作是否和提前測試發生衝突,如果有衝突,就會禁用提前測試。但是,這樣也會造成效能上的下降,因為有更多片元需要被處理了。這也是透明度測試會導致效能下降的