通過一個小Trick實現shader的影象識別/影象統計操作

阿新 • • 發佈：2018-12-22

1.簡介

在日常開發中會遇到諸如判斷某張圖的紅色百分比佔多少的問題，由於gpu運算並行的原因並不能對其進行累加操作。網上一些針對此類問題

的做法是將一張大圖分成多個小塊逐步處理並逐步合併：

但我在思考一種更簡便的方法，於是想到在頂點shader裡做判斷檢測，在畫素shader裡獲取結果這樣一個形式：

用一組頂點去讀單個畫素，判斷失敗的頂點座標提交到螢幕外，而判斷成功的頂點座標放在螢幕內。

最後在CPU中獲取是否有螢幕內頂點這樣一個結果，來進行簡單的識別操作。

而在開啟透明之後，還可以用透明度疊加來獲取更復雜的結果。

2.實踐

首先實踐結果並沒有想象的那麼好，因為如果純用三角面來做頂點部分的判斷未免太費效率了。

所以我改成了傳入頂點判斷並生成面的方式，並且縮小了傳入圖片的畫素大小。

畢竟更多的運用場合是用來做刮刮卡或者擦除的識別。只需要檢測mask圖片。

上程式碼：

Shader "Hidden/FooShader"
{
    Properties
    {
    }
    SubShader
    {
        Blend One One

        tags
        {
            "Queue" = "Transparent"
            "RenderType" = "Transparent"
        }

        Pass
        {
            CGPROGRAM
             
#pragma target 4.0
            #pragma vertex vert
            #pragma geometry geom
            #pragma fragment frag

            #include "UnityCG.cginc"

            struct v2f
            {
                float4 color : COLOR;
                float4 vertex : SV_POSITION;
            };

            v2f vert( 
uint vid : SV_VertexID)
            {
                v2f o = (v2f)0;

                o.vertex = 0;

                int roll = vid % 4;

                if(roll == 0)
                    o.color = float4(0.05, 0, 0, 0);

                if (roll == 1)
                    o.color = float4(0, 0.05, 0, 0);

                if (roll == 2)
                    o.color = float4(0, 0, 0.05, 0);

                if (roll == 3)
                    o.color = float4(0, 0, 0, 0.05);

                return o;
            }

            [maxvertexcount(4)]
            void geom(point v2f vertElement[1], inout TriangleStream<v2f> triStream)
            {
                float size = 10;

                float4 v1 = vertElement[0].vertex + float4(-size, -size, 0, 0);
                float4 v2 = vertElement[0].vertex + float4(-size, size, 0, 0);
                float4 v3 = vertElement[0].vertex + float4(size, -size, 0, 0);
                float4 v4 = vertElement[0].vertex + float4(size, size, 0, 0);

                v2f r = (v2f)0;

                r.vertex = mul(UNITY_MATRIX_VP, v1);
                r.color = vertElement[0].color;
                triStream.Append(r);

                r.vertex = mul(UNITY_MATRIX_VP, v2);
                r.color = vertElement[0].color;
                triStream.Append(r);

                r.vertex = mul(UNITY_MATRIX_VP, v3);
                r.color = vertElement[0].color;
                triStream.Append(r);

                r.vertex = mul(UNITY_MATRIX_VP, v4);
                r.color = vertElement[0].color;
                triStream.Append(r);
            }

            fixed4 frag(v2f i) : SV_Target
            {
                return i.color;
            }
            ENDCG
        }
    }
}

FooShader.shader

using System.Collections;
using System.Collections.Generic;
using UnityEngine;
using UnityEngine.Rendering;

namespace Hont
{
    public class Foo : MonoBehaviour
    {
        void Start()
        {
            var mat = new Material(Shader.Find("Hidden/FooShader"));
            mat.SetPass(0);
            var tempRT = RenderTexture.GetTemporary(16, 16, 0, RenderTextureFormat.ARGB32, RenderTextureReadWrite.sRGB, 1);
            tempRT.filterMode = FilterMode.Point;
            tempRT.autoGenerateMips = false;
            tempRT.anisoLevel = 0;
            tempRT.wrapMode = TextureWrapMode.Clamp;
            var cacheRT = RenderTexture.active;
            RenderTexture.active = tempRT;
            Graphics.DrawProcedural(MeshTopology.Points, 10, 1);
            var tex2D = new Texture2D(16, 16, TextureFormat.ARGB32, false, false);
            tex2D.wrapMode = TextureWrapMode.Clamp;
            tex2D.anisoLevel = 0;
            tex2D.filterMode = FilterMode.Point;
            tex2D.ReadPixels(new Rect(0, 0, 16, 16), 0, 0);
            var firstPixel = tex2D.GetPixel(0, 0);
            Debug.Log("firstPixel: " + firstPixel);
            RenderTexture.active = cacheRT;
            RenderTexture.ReleaseTemporary(tempRT);
        }
    }
}

Foo.cs

跑了一下程式碼之後我發現了兩個問題，也是沒解決的問題，一個是計算結果有誤差

o.color = float4(0.05, 0, 0, 0);

特別是當返回顏色小於0.1之後，我嘗試改變影象格式或者RT等引數依舊沒能解決

第二個問題是開啟透明後，透明圖片的疊加是有上限的，畢竟深度有限。

對於第一個問題，目前還不需要太精確所以沒解決但也能用。第二個問題可以用一些方法來緩解

比如在頂點shader中增加運算量，把返回值分散到rgba四個通道上去。

int roll = vid % 4;

if(roll == 0)
    o.color = float4(0.05, 0, 0, 0);

if (roll == 1)
    o.color = float4(0, 0.05, 0, 0);

if (roll == 2)
    o.color = float4(0, 0, 0.05, 0);

if (roll == 3)
    o.color = float4(0, 0, 0, 0.05);

return o;

把更多的畫素遍歷放入頂點中，這樣頂點shader處理的圖片大小會小n/1:

v2f vert(uint vid : SV_VertexID)
{
    v2f o = (v2f)0;

    o.vertex = 0;

    half2 image_size = half2(_SampleFilter.x * _LoopImageSize.x, _SampleFilter.y * _LoopImageSize.y);

    half y = floor(vid / _LoopImageSize.x);
    half x = (vid - y * _LoopImageSize.x) / _LoopImageSize.x;
    y = y / _LoopImageSize.y;

    for (half rx = 0; rx < _SampleFilter.x; rx++)
    {
        for (half ry = 0; ry < _SampleFilter.y; ry++)
        {
            half xx = x + rx;
            half yy = y + ry;

            float4 r = statistics_sample(_Image, _Rec_Color, half4(xx, yy, 0, 0), image_size);

            o.color += r;
        }
    }

    return o;
}

3.優化再測試

最終達到了一個比較不錯的結果，我把相關函式封裝成了一個類。

我寫了一個塗抹效果demo來測試一下，它通過識別白色畫素的數量來判斷是否為全部塗完：

通過這個小Trick其實可以在畫素裡返回更多的資訊，簡單的場合這麼還是比較方便的，當然一些複雜的情況分塊+computer shader來做其實更合適。

通過一個小Trick實現shader的影象識別/影象統計操作

1.簡介在日常開發中會遇到諸如判斷某張圖的紅色百分比佔多少的問題，由於gpu運算並行的原因並不能對其進行累加操作。網上一些針對此類問題的做法是將一張大圖分成多個小塊逐步處理並逐步合併：但我在思考一種更簡便的方法，於是想到在頂點shader裡做判斷檢測，在畫素shader裡獲取結果這樣一個形式：用

tomcat通過一個端口號實現多域名訪問

項目編輯虛擬目錄 com 解決 name 虛擬 tom src 最近在一個項目中遇到這樣的一個場景，在一臺服務器一個tomcat一個端口配置多個域名。沒想到解決方法這麽簡單，通過虛擬目錄來實現。修改tomcat安裝路徑下/conf下的server.xml vim編輯

日期插件的一個小特效實現

com .cn pan css margin htm mar laydate image html代碼<div class="Date_selection" style="display:none"> <span class="label_name"&g

201671010127 2016—2017-2 通過一個小程序對Java的再認識。

實現字符串和字符代碼 generated 字符串的操作以及 math ext 兩個　　學習了將近四周的Java語言，對於Java語言，我也有了更進一步的理解，出於對Java語言的喜愛，我總是喜歡沒事的時候，自己敲一些很簡單的代碼，一邊學習Java語言，一邊對比C語言

用shell實現一個小指令碼，用來同來統計自己某個檔案下的程式碼，總的程式碼行數，總的註釋量，總的空行量？支援遍歷查詢，支援軟連結查詢

[[email protected] yunwei]# cat sum_code_row_version1.4.sh #!/bin/bash # File Name: sum_code_row.sh # Author: Liwqiang # mail: [email

pcl1.8.0+QT5.7.0+vs2013 win7 x64環境配置以及第一個小程式實現

幾經波折終於配置成功，現在總結下網路上的較簡潔的方法分享給大家（第一次寫博，謝大家支援）主要參考部落格： http://blog.csdn.net/u012750702/article/details/53046210 http://blog.csdn.net/woka

通過一個小故事，理解 HTTPS 工作原理

本文摘錄參考： HTTP 協議由於是明文傳送，所以存在三大風險： 1、被竊聽的風險：第三方可以截獲並檢視你的內容 2、被篡改的危險：第三方可以截獲並修改你的內容 3、被冒充的風險：第三方可以偽裝成通訊方與你通訊 HTTP 因為存在以上三大安全風險，所以才有了 HTTPS 的出現。 HTTPS 涉及到了很

通過一個小技巧可以讓flash和iframe的在ie下遮擋問題解決

最近在研究一個openlaszlo platform平臺的一個小bug.發現了一個在ie下很有意思的bug.一般iframe和flash混用經常都會碰到。ie上解決方式大都選擇wmode設定為transparent.但是swf在transparent的情況下，感應不到mou

oracle job：初學通過一個小例子，說說job

--先看例子：每分鐘向一個表中插入一條資料，所有操作都是在pl/sql環境中，下面提到的異常也都針對pl/sql 例項： create or replace procedure stopApplyBatch_procedure as begin update BIZ_PRO

[Asp.net core 3.1] 通過一個小元件熟悉Blazor服務端元件開發

通過一個小元件，熟悉 Blazor 服務端元件開發。github 一、環境搭建 vs2019 16.4, asp.net core 3.1 新建 Blazor 應用，選擇 asp.net core 3.1。根資料夾下新增目錄 Components，放置程式碼。二、元件需求定義 Components 目錄下

搜狗2019校園招聘筆試-智慧影象識別影象研究員

# -*- coding: utf-8 -*- """ # @Time : 2018/9/14 20:17 # @Author : shen # @FileName: sogou2018.py """ import sys print("輸入資料個數："

C語言通過二叉樹實現單詞出現頻率的統計

一步步記錄自己的成長，在DVE-C++下編譯通過 #include <stdio.h> #include <ctype.h> #include <string.h> #include <stdlib.h> #define MA

每天一個JS 小demo之通過事件委托實現菜單展開及選中特效。主要知識點：事件

實現 tween efi blog dem int position 16px eas <!DOCTYPE html><html lang="en"><head><meta charset="UTF-8"><titl

js通過一個方法實現對象的深淺拷貝。

str else xtend color extend log typeof ror defined 眾所周知，對象的深淺拷貝是工作中肯定會遇到的問題。所以，今天考慮寫個小的功能來記錄一下 //type:boolean,true-deep,true為深拷貝， functi

iOS開發之使用UICollectionView實現美團App的分類功能【偶現大眾點評App的一個小bug】

sso leg 一個 borde spa line 註意 oba alt 郝萌主傾心貢獻，尊重作者的勞動成果，請勿轉載。假設文章對您有所幫助，歡迎給作者捐贈，支持郝萌主，捐贈數額任意，重在心意^_^ 我要捐贈: 點擊捐贈Cocos2d-X源代碼下載：點我傳送遊戲官方下載

通過一個案例分析貝葉斯公式與機器識別

機器學習描述事件滿足 image pos div 是個頻率貝葉斯公式定義如下，公式大家都知道，如何理解呢？下面給一個機器識別相關的例子，直觀地說明。在機器識別中，假設機器要識別“一”所在的這個小圖像塊表示什麽字符（可以想象為拿手機對著一頁書拍了張照片，機器要

Vue.js 的一個小技巧---利用v-for中的index值，來實現隔行變色

type 樣式 lin class idt title mes har oct 　　首先定義好樣式，利用v-for中的index值，然後綁定樣式來實現隔行變色效果。　　以下為完整代碼，很簡單，但也是個技巧。 <!DOCTYPE html> &

Python使用tensorflow實現影象識別（貓狗大戰）-01

Python使用tensorflow實現影象識別（貓狗大戰）-01 import_data.py import tensorflow as tf import numpy as np import os #引入tensorflow、numpy、os 三個第三方模組 img_widt

Python——百度AI影象識別API實現動物識別

摘要：百度AI的文件中心是Python2寫的示例程式碼，我的是Python3，之間遇到一些問題，主要是字串的編碼問題，後面有總結。以下是修改之後的Python3 示例程式碼一、獲取access_token示例程式碼 import urllib.request # client_id

python打造特別火的一個小遊戲，16行程式碼實現3D撞球小遊戲！

以下是製作上面炫酷動畫所需的全部程式碼：我們需要三組剛體（當您在Blender的物件上開啟一個剛體的屬性時，Blender將模擬與其它剛體的碰撞）： 1.平面第2行程式碼建立了一個簡單的平面，立方體將放置在

通過一個小Trick實現shader的影象識別/影象統計操作

1.簡介

2.實踐

3.優化再測試

相關推薦