1. 程式人生 > >python3__深度學習:計算機視覺__Gamma變換

python3__深度學習:計算機視覺__Gamma變換

【參考資料】https://blog.csdn.net/lichengyu/article/details/8457425

                     http://www.jb51.net/article/137566.htm

1.什麼是Gamma變換

Gamma變換是對輸入影象灰度值進行的非線性操作,使輸出影象灰度值與輸入影象灰度值呈指數關係:這個指數即為Gamma。

Gamma變換就是用來影象增強,其提升了暗部細節,簡單來說就是通過非線性變換,讓影象從暴光強度的線性響應變得更接近人眼感受的響應,即將漂白(相機曝光)或過暗(曝光不足)的圖片,進行矯正。

經過Gamma變換後的輸入和輸出影象灰度值關係如圖1所示:橫座標是輸入灰度值,縱座標是輸出灰度值,藍色曲線是gamma值小於1時的輸入輸出關係,紅色曲線是gamma值大於1時的輸入輸出關係。可以觀察到,當gamma值小於1時(藍色曲線),影象的整體亮度值得到提升,同時低灰度處的對比度得到增加,更利於分辯低灰度值時的影象細節。

圖1  Gamma校正

二、為什麼進行Gamma變換

1. 人眼對外界光源的感光值與輸入光強不是呈線性關係的,而是呈指數型關係的。在低照度下,人眼更容易分辨出亮度的變化,隨著照度的增加,人眼不易分辨出亮度的變化。而攝像機感光與輸入光強呈線性關係。如圖2所示:

圖2  人眼和攝像機的感光與實際輸入光強的關係

為方便人眼辨識影象,需要將攝像機採集的影象進行Gamma變換。

2. 為能更有效的儲存影象亮度資訊,需進行Gamma變換。

未經Gamma變換和經過Gamma變換儲存影象資訊如圖3所示:

圖3  未經Gamma變換和經過Gamma變換儲存影象資訊

可以觀察到,未經Gamma變換的情況下,低灰度時,有較大範圍的灰度值被儲存成同一個值,造成資訊丟失;同時高灰度值時,很多比較接近的灰度值卻被儲存成不同的值,造成空間浪費。經過Gamma變換後,改善了儲存的有效性和效率。

三、Gamma變換的基本形式

大於1時,對影象的灰度分佈直方圖具有拉伸作用(使灰度向高灰度值延展),而小於1時,對影象的灰度分佈直方圖具有收縮作用(是使灰度向低灰度值方向靠攏)。

四、Python下有關Gamma變換的示例程式碼

import cv2
#分道計算每個通道的直方圖
img0 = cv2.imread('12.jpg')
hist_b = cv2.calcHist([img0],[0],None,[256],[0,256])
hist_g = cv2.calcHist([img0],[1],None,[256],[0,256])
hist_r = cv2.calcHist([img0],[2],None,[256],[0,256])
def gamma_trans(img,gamma):
    #具體做法先歸一化到1,然後gamma作為指數值求出新的畫素值再還原
    gamma_table = [np.power(x/255.0,gamma)*255.0 for x in range(256)]
    gamma_table = np.round(np.array(gamma_table)).astype(np.uint8)
    #實現對映用的是Opencv的查表函式
    return cv2.LUT(img0,gamma_table)
img0_corrted = gamma_trans(img0, 0.5)
cv2.imshow('img0',img0)
cv2.imshow('gamma_image',img0_corrted)
cv2.imwrite('gamma_image.png',img0_corrted)
#分通道計算Gamma校正後的直方圖
hist_b_c =cv2.calcHist([img0_corrted],[0],None,[256],[0,256])
hist_g_c =cv2.calcHist([img0_corrted],[1],None,[256],[0,256])
hist_r_c =cv2.calcHist([img0_corrted],[2],None,[256],[0,256])
fig = plt.figure('gamma')
pix_hists = [[hist_b, hist_g, hist_r],
    [hist_b_c, hist_g_c, hist_r_c]]
pix_vals = range(256)
for sub_plt, pix_hist in zip([121, 122], pix_hists):
    ax = fig.add_subplot(sub_plt, projection='3d')
    for c, z, channel_hist in zip(['b', 'g', 'r'], [20, 10, 0], pix_hist):
          cs = [c] * 256
          ax.bar(pix_vals, channel_hist, zs=z, zdir='y', color=cs, alpha=0.618, edgecolor='none', lw=0)
    ax.set_xlabel('Pixel Values')
    ax.set_xlim([0, 256])
    ax.set_ylabel('Count')
    ax.set_zlabel('Channels')
plt.show()
cv2.waitKey()