您好,登錄后才能下訂單哦!
今天就跟大家聊聊有關如何分析Python圖像處理中的幾何變換,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。
圖像幾何變換不改變圖像的像素值,在圖像平面上進行像素變換。適當的幾何變換可以最大程度地消除由于成像角度、透視關系乃至鏡頭自身原因所造成的幾何失真所產生的負面影響。幾何變換常常作為圖像處理應用的預處理步驟,是圖像歸一化的核心工作之一[1]。
一個幾何變換需要兩部分運算:
空間變換:包括平移、縮放、旋轉和正平行投影等,需要用它來表示輸出圖像與輸入圖像之間的像素映射關系。
灰度插值算法:按照這種變換關系進行計算,輸出圖像的像素可能被映射到輸入圖像的非整數坐標上[2]。
圖像幾何變換在變換過程中會建立一種原圖像像素與變換后圖像像素之間的映射關系,通過這種關系,能夠從一方的像素計算出另一方的像素的坐標位置。通常將圖像坐標映射到輸出的過程稱作向前映射,反之,將輸出圖像映射到輸入的過程稱作向后映射。向后映射在實踐中使用較多,原因是能夠避免使用向前映射中出現映射不完全和映射重疊的問題。
圖6-1展示了圖像放大的示例,右邊圖中只有(0,0)、(0,2)、(2,0)、(2,2)四個坐標根據映射關系在原圖像中找到了相對應的像素,其余的12個坐標沒有有效值[3]。
對于數字圖像而言,像素的坐標是離散型非負整數,但是在進行變換的過程中有可能產生浮點坐標值。這在圖像處理中是一個無效的坐標。為了解決這個問題需要用到插值算法。常見算法如下:
最近鄰插值
雙線性插值
雙立方插值
圖像變換是建立在矩陣運算基礎上,通過矩陣運算可以很快找到對應關系。在這篇文章中,我們將介紹常見的圖像幾何變換,包括圖形平移、圖像縮放、圖像旋轉、圖像鏡像、圖像仿射、圖像透視等。
圖像平移是將圖像中的所有像素點按照給定的平移量進行水平或垂直方向上的移動。假設原始像素的位置坐標為(x0,y0),經過平移量(△x,△y)后,坐標變為(x1, y1),如圖6-2所示[3-5]。
用數學式子表示為公式(6-1)。
用矩陣表示如公式(6-2)所示:
式子中,矩陣稱為平移變換矩陣或因子,△x和△y稱為平移量。圖像平移首先定義平移矩陣M,再調用warpAffine()函數實現平移,核心函數如下:
M = np.float32([[1, 0, x], [0, 1, y]])
– M表示平移矩陣,其中x表示水平平移量,y表示垂直平移量
shifted = cv2.warpAffine(src, M, dsize[, dst[, flags[, borderMode[, borderValue]]]])
– src表示原始圖像
– M表示平移矩陣
– dsize表示變換后的輸出圖像的尺寸大小
– dst為輸出圖像,其大小為dsize,類型與src相同
– flag表示插值方法的組合和可選值
– borderValue表示像素外推法,當borderMode = BORDER_TRANSPARENT時,表示目標圖像中的像素不會修改源圖像中的“異常值”。
– borderValue用于邊界不變的情況,默認情況下為0
下面代碼是圖像平移的一個簡單案例,它定義了圖像平移矩陣M,然后調用warpAffine()函數將原始圖像垂直向下平移了50個像素,水平向右平移了100個像素。
# -*- coding:utf-8 -*- # By:Eastmount import cv2 import numpy as np #讀取圖片 src = cv2.imread('scenery.png') #圖像平移矩陣 M = np.float32([[1, 0, 100], [0, 1, 50]]) #獲取原始圖像列數和行數 rows, cols = src.shape[:2] #圖像平移 result = cv2.warpAffine(src, M, (cols, rows)) #顯示圖像 cv2.imshow("original", src) cv2.imshow("result", result) #等待顯示 cv2.waitKey(0) cv2.destroyAllWindows()
輸出結果如圖6-3所示:
下面一個案例是將圖像分別向下、向上、向右、向左平移,再調用matplotlib繪圖庫依次繪制的過程。
# -*- coding:utf-8 -*- # By:Eastmount import cv2 import numpy as np import matplotlib.pyplot as plt #讀取圖片 img = cv2.imread('scenery.png') image = cv2.cvtColor(img,cv2.COLOR_BGR2RGB) #圖像平移 #垂直方向 向下平移100 M = np.float32([[1, 0, 0], [0, 1, 100]]) img1 = cv2.warpAffine(image, M, (image.shape[1], image.shape[0])) #垂直方向 向上平移100 M = np.float32([[1, 0, 0], [0, 1, -100]]) img2 = cv2.warpAffine(image, M, (image.shape[1], image.shape[0])) #水平方向 向右平移100 M = np.float32([[1, 0, 100], [0, 1, 0]]) img3 = cv2.warpAffine(image, M, (image.shape[1], image.shape[0])) #水平方向 向左平移100 M = np.float32([[1, 0, -100], [0, 1, 0]]) img4 = cv2.warpAffine(image, M, (image.shape[1], image.shape[0])) #循環顯示圖形 titles = [ 'Image1', 'Image2', 'Image3', 'Image4'] images = [img1, img2, img3, img4] for i in range(4): plt.subplot(2,2,i+1), plt.imshow(images[i], 'gray') plt.title(titles[i]) plt.xticks([]),plt.yticks([]) plt.show()
輸出結果如圖6-4所示,它從四個方向都進行了平移,并且調用subplot()函數將四個子圖繪制在一起。
圖像縮放(image scaling)是指對數字圖像的大小進行調整的過程。在Python中,圖像縮放主要調用resize()函數實現,函數原型如下:
result = cv2.resize(src, dsize[, result[. fx[, fy[, interpolation]]]])
– src表示原始圖像
– dsize表示圖像縮放的大小
– result表示圖像結果
– fx表示圖像x軸方向縮放大小的倍數
– fy表示圖像y軸方向縮放大小的倍數
– interpolation表示變換方法。CV_INTER_NN表示最近鄰插值;CV_INTER_LINEAR表示雙線性插值(缺省使用);
CV_INTER_AREA表示使用像素關系重采樣,當圖像縮小時,該方法可以避免波紋出現,當圖像放大時,類似于CV_INTER_NN;
CV_INTER_CUBIC表示立方插值
常見的圖像縮放兩種方式如下所示,第一種方式是將原圖像設置為(160, 160)像素大小,第二種方式是將原始圖像縮小為0.5倍。
result = cv2.resize(src, (160,160))
result = cv2.resize(src, None, fx=0.5, fy=0.5)
設(x1, y1)是縮放后的坐標,(x0, y0)是縮放前的坐標,sx、sy為縮放因子,則圖像縮放的計算公式(6-3)所示:
下面是Python實現圖像縮放的代碼,它將所讀取的風景圖像進行縮小。
# -*- coding:utf-8 -*- # By:Eastmount import cv2 import numpy as np #讀取圖片 src = cv2.imread('scenery.png') #圖像縮放 result = cv2.resize(src, (200,100)) print(result.shape) #顯示圖像 cv2.imshow("original", src) cv2.imshow("result", result) #等待顯示 cv2.waitKey(0) cv2.destroyAllWindows()
輸出結果如圖6-5所示,圖像縮小為(100, 200, 3)像素。注意,代碼中調用函數 cv2.resize(src, (200,100)) 設置新圖像大小dsize的列數為200,行數為100。
下面講解另一種圖像縮放變換的方法,通過原始圖像像素乘以縮放系數進行圖像變換,代碼如下:
# -*- coding:utf-8 -*- # By:Eastmount import cv2 import numpy as np #讀取圖片 src = cv2.imread('scenery.png') rows, cols = src.shape[:2] print(rows, cols) #圖像縮放 dsize(列,行) result = cv2.resize(src, (int(cols*0.6), int(rows*1.2))) #顯示圖像 cv2.imshow("src", src) cv2.imshow("result", result) cv2.waitKey(0) cv2.destroyAllWindows()
獲取圖片“scenery.png”的元素像素值,其rows值為384,cols值為512,接著進行寬度縮小0.6倍、高度放大1.2倍的處理,運行前后對比效果如圖6-6所示。
最后講解調用(fx,fy)參數設置縮放倍數的方法,對原始圖像進行放大或縮小操作。下面代碼是fx和fy方向縮小至原始圖像0.3倍的操作。
# -*- coding:utf-8 -*- # By:Eastmount import cv2 import numpy as np #讀取圖片 src = cv2.imread('scenery.png') rows, cols = src.shape[:2] print(rows, cols) #圖像縮放 result = cv2.resize(src, None, fx=0.3, fy=0.3) #顯示圖像 cv2.imshow("src", src) cv2.imshow("result", result) #等待顯示 cv2.waitKey(0) cv2.destroyAllWindows()
輸出的結果如圖6-7所示,這是按比例0.3×0.3縮小的。
圖像旋轉是指圖像以某一點為中心旋轉一定的角度,形成一幅新的圖像的過程。圖像旋轉變換會有一個旋轉中心,這個旋轉中心一般為圖像的中心,旋轉之后圖像的大小一般會發生改變。圖6-8表示原始圖像的坐標(x0, y0)旋轉至(x1, y1)的過程。
旋轉公式如(6-4)所示,其中(m,n)是旋轉中心,a是旋轉的角度,(left,top)是旋轉后圖像的左上角坐標。
圖像旋轉變換主要調用getRotationMatrix2D()函數和warpAffine()函數實現,繞圖像的中心旋轉,函數原型如下:
M = cv2.getRotationMatrix2D(center, angle, scale)
– center表示旋轉中心點,通常設置為(cols/2, rows/2)
– angle表示旋轉角度,正值表示逆時針旋轉,坐標原點被定為左上角
– scale表示比例因子
rotated = cv2.warpAffine(src, M, (cols, rows))
– src表示原始圖像
– M表示旋轉參數,即getRotationMatrix2D()函數定義的結果
– (cols, rows)表示原始圖像的寬度和高度
實現代碼如下所示:
# -*- coding:utf-8 -*- # By:Eastmount import cv2 import numpy as np #讀取圖片 src = cv2.imread('scenery.png') #源圖像的高、寬 以及通道數 rows, cols, channel = src.shape #繞圖像的中心旋轉 #函數參數:旋轉中心 旋轉度數 scale M = cv2.getRotationMatrix2D((cols/2, rows/2), 30, 1) #函數參數:原始圖像 旋轉參數 元素圖像寬高 rotated = cv2.warpAffine(src, M, (cols, rows)) #顯示圖像 cv2.imshow("src", src) cv2.imshow("rotated", rotated) #等待顯示 cv2.waitKey(0) cv2.destroyAllWindows()
顯示效果如圖6-9所示,繞圖像中心點逆時針旋轉30度。
看完上述內容,你們對如何分析Python圖像處理中的幾何變換有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注億速云行業資訊頻道,感謝大家的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。