您好,登錄后才能下訂單哦!
本文介紹了python OpenCV學習筆記直方圖反向投影的實現,分享給大家,具體如下:
官方文檔 – https://docs.opencv.org/3.4.0/dc/df6/tutorial_py_histogram_backprojection.html
它用于圖像分割或尋找圖像中感興趣的對象。簡單地說,它創建一個與我們的輸入圖像相同大小(但單通道)的圖像,其中每個像素對應于屬于我們對象的像素的概率。輸出圖像將使我們感興趣的對象比其余部分更白。
該怎么做呢?我們創建一個圖像的直方圖,其中包含我們感興趣的對象。為了得到更好的結果,對象應該盡可能地填充圖像。而顏色直方圖比灰度直方圖更受青睞,因為對象的顏色比灰度強度更能定義對象。然后,我們在我們的測試圖像上“反向投射”這個直方圖,我們需要找到這個對象,換句話說,我們計算每個像素的概率,并顯示它。在適當的閾值上產生的輸出結果使我們得到了一個單獨的結果。
Numpy中的算法
1、首先,我們需要計算我們需要找到的對象的顏色直方圖(讓它為'M')和我們將要搜索的圖像(讓它為'I')。
import numpy as np import cv2 as cv from matplotlib import pyplot as plt # roi是我們需要找到的對象或區域 roi = cv.imread('rose_red.png') hsv = cv.cvtColor(roi, cv.COLOR_BGR2HSV) # target是我們搜索的圖像 target = cv.imread('rose.png') hsvt = cv.cvtColor(target, cv.COLOR_BGR2HSV) # 用calcHist來找直方圖,也可以用np.histogram2d M = cv.calcHist([hsv], [0,1], None, [180,256], [0,180,0,256]) I = cv.calcHist([hsvt], [0,1], None, [180,256], [0,180,0,256])
2、找到比率 R=M/I。然后背面投射R ,使用R作為調色板,并創建一個新的圖像,每個像素作為其對應的目標概率。B(x,y) = R[h(x,y),s(x,y)],其中h是(x,y)坐標像素的色調,s是飽和度。之后,B(x,y)=min[B(x,y),1]
h, s, v = cv.split(hsvt) B = R[h.ravel(), s.ravel()] B = np.munimum(B, 1) B = B.reshape(hsvt.shape[:2])
3、應用一個圓盤卷積,B = D * B,其中D是圓盤內核
disc = cv.getStructuringElement(cv.MORPH_ELLIPSE, (5,5)) cv.filter2D(B, -1, disc, B) B = np.uint8(B) cv.normalize(B, B, 0, 255, cv.NORM_MINMAX)
4、現在,最大強度的位置給了我們物體的位置。如果我們期望圖像中有一個區域,給出一個合適的閾值會有一個很好的結果。
ret, thresh = cv.threshold(B, 50, 255, 0)
OpenCV中的投影
OpenCV提供一個內置的函數cv.calcbackproject()。它的參數幾乎與cv.calcHist()函數相同。它的一個參數是直方圖,它是這個對象的直方圖,我們必須找到它。另外,在傳遞給backproject函數之前,對象的直方圖應該是標準化的。它返回概率圖像。然后,我們將圖像與磁盤內核進行卷積,并應用閾值。下面是我的代碼和輸出:
import numpy as np import cv2 as cv roi = cv.imread('rose_red.png') hsv = cv.cvtColor(roi, cv.COLOR_BGR2HSV) target = cv.imread('rose.png') hsvt = cv.cvtColor(target, cv.COLOR_BGR2HSV) # 計算對象的直方圖 roihist = cv.calcHist([hsv], [0,1], None, [180,256], [0,180,0,256]) # 標準化直方圖,并應用投影 cv.normalize(roihist, roihist, 0, 255, cv.NORM_MINMAX) dst = cv.calcBackProject([hsvt], [0,1], roihist, [0,180,0,256], 1) # 與磁盤內核進行卷積 disc = cv.getStructuringElement(cv.MORPH_ELLIPSE, (5,5)) cv.filter2D(dst, -1, disc, dst) # 閾值、二進制按位和操作 ret, thresh = cv.threshold(dst, 50, 255, 0) thresh = cv.merge((thresh, thresh, thresh)) res = cv.bitwise_and(target, thresh) res = np.vstack((target, thresh, res)) cv.imwrite('res.jpg', res)
下面是一個例子。使用藍色矩形中的區域作為示例對象,提取想提取全部內容。
關于這兩種技術的原理可以參考我上面貼的鏈接,下面是示例的代碼:
0x01. 繪制直方圖
import cv2.cv as cv def drawGraph(ar,im, size): #Draw the histogram on the image minV, maxV, minloc, maxloc = cv.MinMaxLoc(ar) #Get the min and max value hpt = 0.9 * histsize for i in range(size): intensity = ar[i] * hpt / maxV #Calculate the intensity to make enter in the image cv.Line(im, (i,size), (i,int(size-intensity)),cv.Scalar(255,255,255)) #Draw the line i += 1 #---- Gray image orig = cv.LoadImage("img/lena.jpg", cv.CV_8U) histsize = 256 #Because we are working on grayscale pictures which values within 0-255 hist = cv.CreateHist([histsize], cv.CV_HIST_ARRAY, [[0,histsize]], 1) cv.CalcHist([orig], hist) #Calculate histogram for the given grayscale picture histImg = cv.CreateMat(histsize, histsize, cv.CV_8U) #Image that will contain the graph of the repartition of values drawGraph(hist.bins, histImg, histsize) cv.ShowImage("Original Image", orig) cv.ShowImage("Original Histogram", histImg) #--------------------- #---- Equalized image imEq = cv.CloneImage(orig) cv.EqualizeHist(imEq, imEq) #Equlize the original image histEq = cv.CreateHist([histsize], cv.CV_HIST_ARRAY, [[0,histsize]], 1) cv.CalcHist([imEq], histEq) #Calculate histogram for the given grayscale picture eqImg = cv.CreateMat(histsize, histsize, cv.CV_8U) #Image that will contain the graph of the repartition of values drawGraph(histEq.bins, eqImg, histsize) cv.ShowImage("Image Equalized", imEq) cv.ShowImage("Equalized HIstogram", eqImg) #-------------------------------- cv.WaitKey(0)
0x02. 反向投影
import cv2.cv as cv im = cv.LoadImage("img/lena.jpg", cv.CV_8U) cv.SetImageROI(im, (1, 1,30,30)) histsize = 256 #Because we are working on grayscale pictures hist = cv.CreateHist([histsize], cv.CV_HIST_ARRAY, [[0,histsize]], 1) cv.CalcHist([im], hist) cv.NormalizeHist(hist,1) # The factor rescale values by multiplying values by the factor _,max_value,_,_ = cv.GetMinMaxHistValue(hist) if max_value == 0: max_value = 1.0 cv.NormalizeHist(hist,256/max_value) cv.ResetImageROI(im) res = cv.CreateMat(im.height, im.width, cv.CV_8U) cv.CalcBackProject([im], res, hist) cv.Rectangle(im, (1,1), (30,30), (0,0,255), 2, cv.CV_FILLED) cv.ShowImage("Original Image", im) cv.ShowImage("BackProjected", res) cv.WaitKey(0)
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持億速云。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。