OpenCV影象處理--為影象新增Logo

阿新 • • 發佈：2019-01-04

1，目的

將logo圖示疊加到一張圖片的右上角，要求有顏色的區域為不透明，例如將阿里影業的Logo疊加到戰狼2的海報上，原始圖和效果圖如下。

2，思路

不同的logo有不同的處理方法，有的是黑色需要透明，有的是白色需要透明，但是，整理的思路是一致的。

如下圖所示，從上向下，對要形成的效果進行分解，一共分為3層。

第一層需要第二層的兩張圖片，做cv2.add運算即可
第二層第一張圖片需要第三層前兩張圖片，做cv2.bitwise_and運算即可，後一張做mask
第二層第二張圖片需要第三層後兩張圖片，做cv2.bitwise_and運算即可，後一張做mask

method of img deal.png

在分解過程中，需要思考和明確要呼叫的OpenCV函式。如果一步解決不了，就拆分成多步解決。

3，步驟分析

基於上述思路，制定詳細的影象處理步驟，並進行編碼除錯。處理步驟如下圖所示。

ali-logo deal process.png

3.1，讀取logo圖片，並對logo按照20%進行縮放

img_logo = cv2.imread("d:/1/ali-movie.png", cv2.IMREAD_COLOR)
img_logo = cv2.resize(img_logo, (0, 0), fx=0.2, fy=0.2, interpolation=cv2.INTER_NEAREST)

3.2，對logo進行灰度化處理，得到兩個mask

img_logo_gray = cv2.cvtColor(img_logo, cv2.COLOR 
_BGR2GRAY)
ret, img_logo_mask = cv2.threshold(img_logo_gray, 200, 255, cv2.THRESH_BINARY)  # 二值化函式
img_logo_mask1 = cv2.bitwise_not(img_logo_mask)

3.3，提取目標圖片的ROI

img_target = cv2.imread("d:/1/wolf.jpg", cv2.IMREAD_COLOR)
rows, cols, channel = img_logo.shape
rows1, cols1, channel1 = img_target.shape 

img_roi = img_target[:rows, cols1 - cols:cols1].copy()

3.4，ROI和Logo影象融合

img_res0 = cv2.bitwise_and(img_roi, img_roi, mask=img_logo_mask)
img_res1 = cv2.bitwise_and(img_logo, img_logo, mask=img_logo_mask1)
img_res2 = cv2.add(img_res0, img_res1)
# img_res2 = img_res0 + img_res1
img_target[:rows, cols1 - cols:cols1] = img_res2[:, :]
cv2.imwrite("img_target.png", img_target)

4，疑難點介紹

4.1，cv2.add與矩陣相加的區別

測試程式

import numpy as np
import cv2
x = np.uint8([250])
y = np.uint8([10])
print cv2.add(x,y)   #輸出# [[255]]
print x+y            #輸出# [4]  (250+10)%255

測試結論

cv2.add方法和numpy矩陣相加，都可以完成兩張圖片的相加運算
numpy矩陣相加是模運算
cv2.add是滲透運算，如果元素之和大於255，則按照255返回，可以直接相加兩張圖片試試效果，程式碼和效果圖如下所示

img_logo = cv2.imread("d:/1/ali-movie.png", cv2.IMREAD_COLOR)
img_target = cv2.imread("d:/1/wolf.jpg", cv2.IMREAD_COLOR)
print img_logo.shape, img_target.shape
img_new_add = cv2.add(img_target[:516, :798], img_logo[:516, :798])
cv2.imshow("img_new_add", img_new_add)
cv2.waitKey(0)
cv2.destroyAllWindows()

cv2.add.png

4.2，matplotlib的subplot簡單介紹

程式碼如下，效果圖如method of img deal.png所示。

程式碼

# 顯示圖片，呼叫matplotlib展示
plt.figure()
plt.subplot(332), plt.imshow(img_convert(img_res2), cmap='gray'), plt.title("img_res2")
plt.subplot(323), plt.imshow(img_convert(img_res0), cmap='gray'), plt.title("img_res0")
plt.subplot(324), plt.imshow(img_convert(img_res1), cmap='gray'), plt.title("img_res1")
plt.subplot(3, 4, 9), plt.imshow(img_convert(img_roi), cmap='gray'), plt.title("img_roi")
plt.subplot(3, 4, 10), plt.imshow(img_convert(img_logo_mask), cmap='gray'), plt.title("img_logo_mask")
plt.subplot(3, 4, 11), plt.imshow(img_convert(img_logo), cmap='gray'), plt.title("img_logo")
plt.subplot(3, 4, 12), plt.imshow(img_convert(img_logo_mask1), cmap='gray'), plt.title("img_logo_mask1")
plt.show()

效果圖

method of img deal.png

5，原始碼奉上

# coding:utf8

import numpy as np
import cv2
from matplotlib import pyplot as plt


# 影象處理，將logo圖示疊加到一張圖片的右上角，要求有顏色的區域為不透明
def img_deal():
    # 1，對logo進行縮放，按照20%進行
    img_logo = cv2.imread("d:/1/ali-movie.png", cv2.IMREAD_COLOR)
    img_logo = cv2.resize(img_logo, (0, 0), fx=0.2, fy=0.2, interpolation=cv2.INTER_NEAREST)
    # cv2.imshow("img_logo", img_logo)

    # 2，對logo做清洗，白色區域是255，其他區域置為黑色0
    img_logo_gray = cv2.cvtColor(img_logo, cv2.COLOR_BGR2GRAY)
    ret, img_logo_mask = cv2.threshold(img_logo_gray, 200, 255, cv2.THRESH_BINARY)  # 二值化函式
    img_logo_mask1 = cv2.bitwise_not(img_logo_mask)
    # cv2.imshow("img_logo_gray", img_logo_gray)
    # cv2.imshow("img_logo_mask", img_logo_mask)

    # 3，提取目標圖片的ROI
    img_target = cv2.imread("d:/1/wolf.jpg", cv2.IMREAD_COLOR)
    rows, cols, channel = img_logo.shape
    rows1, cols1, channel1 = img_target.shape
    img_roi = img_target[:rows, cols1 - cols:cols1].copy()
    # cv2.imshow("img_roi", img_roi)

    # 4，ROI和Logo影象融合
    img_res0 = cv2.bitwise_and(img_roi, img_roi, mask=img_logo_mask)
    img_res1 = cv2.bitwise_and(img_logo, img_logo, mask=img_logo_mask1)
    img_res2 = cv2.add(img_res0, img_res1)
    # img_res2 = img_res0 + img_res1
    img_target[:rows, cols1 - cols:cols1] = img_res2[:, :]
    cv2.imwrite("img_target.png", img_target)

    # 顯示圖片，呼叫opencv展示
    # cv2.imshow("img_res0", img_res0)
    # cv2.imshow("img_res1", img_res1)
    # cv2.imshow("img_res2", img_res2)
    # cv2.imshow("img_target", img_target)
    # cv2.waitKey(0)
    # cv2.destroyAllWindows()

    # 顯示圖片，呼叫matplotlib展示
    plt.figure()
    titles = ["img_logo", "img_logo_gray", "img_logo_mask", "img_logo_mask1", "img_roi", "img_res0", "img_res1",
              "img_res2"]
    imgs = [img_logo, img_logo_gray, img_logo_mask, img_logo_mask1, img_roi, img_res0, img_res1, img_res2]
    for x in xrange(len(imgs)):
        plt.subplot(241 + x), plt.imshow(img_convert(imgs[x]), cmap='gray'), plt.title(titles[x])  # , plt.axis('off')
    plt.show()

    # 顯示圖片，呼叫matplotlib展示
    plt.figure()
    plt.subplot(332), plt.imshow(img_convert(img_res2), cmap='gray'), plt.title("img_res2")
    plt.subplot(323), plt.imshow(img_convert(img_res0), cmap='gray'), plt.title("img_res0")
    plt.subplot(324), plt.imshow(img_convert(img_res1), cmap='gray'), plt.title("img_res1")
    plt.subplot(3, 4, 9), plt.imshow(img_convert(img_roi), cmap='gray'), plt.title("img_roi")
    plt.subplot(3, 4, 10), plt.imshow(img_convert(img_logo_mask), cmap='gray'), plt.title("img_logo_mask")
    plt.subplot(3, 4, 11), plt.imshow(img_convert(img_logo), cmap='gray'), plt.title("img_logo")
    plt.subplot(3, 4, 12), plt.imshow(img_convert(img_logo_mask1), cmap='gray'), plt.title("img_logo_mask1")
    plt.show()


# cv2與matplotlib的影象轉換，cv2是bgr格式，matplotlib是rgb格式
def img_convert(cv2_img):
    # 灰度圖片直接返回
    if len(cv2_img.shape) == 2:
        return cv2_img
    # 3通道的BGR圖片
    elif len(cv2_img.shape) == 3 and cv2_img.shape[2] == 3:
        b, g, r = cv2.split(cv2_img)
        return cv2.merge((r, g, b))
    # 4通道的BGR圖片
    elif len(cv2_img.shape) == 3 and cv2_img.shape[2] == 4:
        b, g, r, a = cv2.split(cv2_img)
        return cv2.merge((r, g, b, a))
    # 未知圖片格式
    else:
        return cv2_img


# 主函式
if __name__ == "__main__":
    img_deal()

6，參考頁面

OpenCV影象處理--為影象新增Logo

1，目的將logo圖示疊加到一張圖片的右上角，要求有顏色的區域為不透明，例如將阿里影業的Logo疊加到戰狼2的海報上，原始圖和效果圖如下。 2，思路不同的logo有不同的處理方法，有的是黑色需要透明，有的是白色需要透明，但是，整理的思路

OpenCV影象處理--將影象裁剪為圓形

1，需求為了便於專案前端展示使用者頭像，需要將頭像處理為圓形，非圓形區域設定為透明。其實，前端可以在顯示的時候處理，但是前端採用WebGL，暫時搞不定，所以由後端進行影象的一次性加工。於是，我們嘗試用Linux工具Convert來完成，但是，百思無解，後

C#把影象處理為正方形影象

摘要：在C#的winform平臺上利用基於GDI底層圖形引擎（WPF是DirectX圖形引擎，效率更高，該程式碼再WPF上不適用）的操作進行影象的大小處理，轉化為自定義畫素的正方形影象。一基本介面及程式碼 1.圖形介面 2.介面程式碼 using System;

使用OpenCV進行影象處理-改變影象的亮度與對比度

通過OpenCV，製作一個有關影象處理的在Linux下的軟體。製作可以自動處理影象亮度的簡單軟體。開發環境：CodeBlocks #include <iostream> #incl

【影象處理】影象濾波去噪聲——均值濾波、中值濾波、對稱均值濾波低通濾波高通濾波（opencv）

①觀察灰度分佈來描述一幅影象成為空間域，觀察影象變化的頻率被成為頻域。 ②頻域分析：低頻對應區域的影象強度變化緩慢，高頻對應的變化快。低通濾波器去除了影象的高頻部分，高通濾波器去除了影象的低頻部分。 (1)低通濾波 ①栗子： #include <iostream> #include &l

影象處理與影象識別筆記（六）影象增強3

上一章節中我們講解了空域濾波的影象增強方法，包括影象的平滑和銳化，本文中，我們首先帶來頻域濾波的影象增強方法，指在頻域中對影象進行變換，需要的基礎知識是前述過的影象傅立葉變換，請檢視學習。一、頻域濾波處理頻域濾波處理的一般方法如下圖所示，先將影象經過傅立葉變換為頻域形式，然後乘以

影象處理與影象識別筆記（五）影象增強2

上一節中我們講解了灰度變換的原理以及實現方法，本節我們講解空域濾波增強，與灰度變換相同，空域濾波增強是一種空域處理的方法，不過空域濾波不是一種對點做處理的方法，而是利用相鄰畫素間的關係進行增強。空域濾波可以按照增強效果的不同分為平滑與銳化兩類，又都可分為線性與非線性方法，線性濾波利用空域卷積

影象處理與影象識別筆記（三）影象增強1

影象增強的目的是為了改善影象的視覺效果，為了更便於人或機器的分析和處理，在不考慮影象降質（前提）的情況下，提高影象的可觀性。灰度變換是一種典型的影象增強方法，我們通常把影象處理按照處理方法分成空域方法與頻域方法兩類，灰度變換是一種對點處理的空域處理方法。一、灰度變換將一個灰度區間

影象處理與影象識別筆記（二）影象變換

在本章節中，將介紹幾種常用的影象變換的方法，即利用數學公式將影象變換成另一種具有特定物理意義的影象，通過新的影象，我們可以觀察出原影象的某些特性，且可以對原影象進行濾波、壓縮等影象處理的操作，包括傅立葉變換、沃爾什變換等。一、影象傅立葉變換基本原理與實現傅立葉變換，是將時域訊號轉

影象處理與影象識別筆記（一）

本系列是研一課程《影象處理與影象識別》的隨堂筆記，主要內容是數字影象處理方面，根據老師的講課內容與自己的理解所書寫，還會有一些具體實現的程式碼，基於Python，歡迎交流。本篇主要介紹影象處理與影象識別的基礎知識。一、影象處理（ImageProcessing）影象處理是對影象資訊

影象處理之影象基本變化（平移、縮放、旋轉）（Octave實現）

在模式識別及計算機視覺中，要經常進行影象的變化。例如：在識別手寫數字中，我們可能在廣泛應用中要求所有的圖片都是20*20這麼好的規格。所以，我們就需要進行縮放來達到目的。今天來總結下學到的影象的基本變換。首先我們計 (w,v) (w,v)為源影象的

Python影象處理：影象腐蝕與影象膨脹！

本篇文章主要講解Python呼叫OpenCV實現影象腐蝕和影象膨脹的演算法，基礎性知識希望對您有所幫助。 1.基礎理論 2.影象腐蝕程式碼實現 3.影象膨脹程式碼實現一. 基礎知識（注：該部分參考作者論文《一種改進的Sobel運算元及區域擇優的身份證智慧識別方法》）影象

影象處理之影象去噪

假設影象退化過程被建模為一個退化函式和一個加性噪聲項，對輸入影象f(x,y)進行處理，產生退化後的影象g(x,y)。給定g(x,y)和退化函式H以及關於加性噪聲項的一些知識，影象復原的目的就是獲得原始影象的一個估計。空間域的退化影象：其中h(x,y)是退化函式的空

影象處理與影象識別筆記（三）影象增強

影象增強的目的是為了改善影象的視覺效果，為了更便於人或機器的分析和處理，在不考慮影象降質（前提）的情況下，提高影象的可觀性。灰度變換是一種典型的影象增強方法。一、灰度變換將一個灰度區間對映到另一個灰度區間的變換稱為灰度變換，g(x,y)=T[f(x,y)]g

[Python影象處理] 七.影象閾值化處理及演算法對比

該系列文章是講解Python OpenCV影象處理知識，前期主要講解影象入門、OpenCV基礎用法，中期講解影象處理的各種演算法，包括影象銳化運算元、影象增強技術、影象分割等，後期結合深度學習研究影象識別、影象分類應用。希望文章對您有所幫助，如果有不足之處，還請

數字影象處理常用影象庫

原文地址：http://blog.sina.com.cn/s/blog_53c74fa1010002pn.html做數字影象處理的，怎能沒有一個相簿？雖說自己可以建立，可是如果是比較知名的相簿，做出來的實驗結果才能比較讓人信服。coral是很有名，可他要收費。我尋尋覓覓，還是找

數字影象處理筆記——影象處理綜述與相關知識介紹

影象獲取方式伽馬光伽馬光成像原理是給人體注入同位素，然後用檢測器來檢測同位素的放射量來成像 X光 X光成像原理是利用人體不同部位密度不同，X光透過性不同，使得成像的灰度值不同 CT CT成像是一組X光不停旋轉以後得到不同角度的成像，從而可以實現

C# 影象處理：影象模糊化

/// <summary> /// 影象模糊化 /// </summary> /// <param name="bitmap">原始影象</param>

數字影象處理筆記——影象分割（Image Segmentation）

影象分割區域生長影象第一種演算法我們稱為區域生長（region growing）其主要思路就是從原始影象中選取幾個重要的點，然後從這些點分別往外擴充套件，如果周圍的畫素與其的畫素差小於某個閾值，那麼將其置1（白色），並繼續從這個點向外延展，直到不滿足條件，其他點置0（黑色）。

影象處理之影象快速插值放縮演算法

演算法思想：基於雙線性演算法的分解，分別進行水平與垂直兩個方向的放縮，完成對整張影象的放大或者縮小。基於的數學思想為矩陣的乘法，對一個scale矩陣可以拆分為水平與垂直方向的兩個關聯矩陣，具體如下：程式解釋：類ScaleFilter完成對影象的快速放大與縮小，

OpenCV影象處理--為影象新增Logo

1，目的

2，思路

3，步驟分析

3.1，讀取logo圖片，並對logo按照20%進行縮放

3.2，對logo進行灰度化處理，得到兩個mask

3.3，提取目標圖片的ROI

3.4，ROI和Logo影象融合

4，疑難點介紹

4.1，cv2.add與矩陣相加的區別

測試程式

測試結論

4.2，matplotlib的subplot簡單介紹

5，原始碼奉上

6，參考頁面

相關推薦