您好,登錄后才能下訂單哦!
前言
今天這篇文章主要記錄一下如何切分驗證碼,用到的主要庫就是Pillow和Linux下的圖像處理工具GIMP。首先假設一個固定位置和寬度、無粘連、無干擾的例子學習一下如何使用Pillow來切割圖片。
使用GIMP打開圖片后,按 加號 放大圖片,然后點擊View->Show Grid來顯示網格線:
其中,每個正方形邊長為10像素,所以數字1切割坐標為左20、上20、右40、下70。以此類推可以知道剩下3個數字的切割位置。
代碼如下:
from PIL import Image p = Image.open("1.png") # 注意位置順序為左、上、右、下 cuts = [(20,20,40,70),(60,20,90,70),(100,10,130,60),(140,20,170,50)] for i,n in enumerate(cuts,1): temp = p.crop(n) # 調用crop函數進行切割 temp.save("cut%s.png" % i)
切割后得到4張圖片:
那么,如果字符位置不固定怎么辦呢?現在假設一種隨機位置寬度、無粘連、無干擾線的情況。
第一種方法,也是最簡單的方法叫做”投影法”。原理就是將二值化后的圖片在豎直方向進行投影,根據投影后的極值來判斷分割邊界。這里我依然使用上面的驗證碼圖片來進行演示:
def vertical(img): """傳入二值化后的圖片進行垂直投影""" pixdata = img.load() w,h = img.size ver_list = [] # 開始投影 for x in range(w): black = 0 for y in range(h): if pixdata[x,y] == 0: black += 1 ver_list.append(black) # 判斷邊界 l,r = 0,0 flag = False cuts = [] for i,count in enumerate(ver_list): # 閾值這里為0 if flag is False and count > 0: l = i flag = True if flag and count == 0: r = i-1 flag = False cuts.append((l,r)) return cuts p = Image.open('1.png') b_img = binarizing(p,200) v = vertical(b_img)
通過vertical函數我們就得到了一個包含所有黑色像素在X軸上投影后左右邊界的位置。由于驗證碼沒有任何干擾,所以我的閾值設定為0。 關于binarizing函數可以參考上一篇文章
輸出如下:
[(21, 37), (62, 89), (100, 122), (146, 164)]
可以看到,投影法給出左右邊界和我們手工查看得到很接近。對于上下邊界,偷懶的可以直接使用0和圖片的高度,也可以在水平方向進行投影,這里有興趣的小伙伴可以自己嘗試。
但是,對于字符間有粘連的情況,投影法就會出現拆分錯誤,比如上篇文章中的:
修改閾值為5后,投影法給出的左右邊界是:
[(5, 27), (33, 53), (59, 108)]
明顯最后的6和9數字沒有切割。
修改閾值為7,結果則是:
[(5, 27), (33, 53), (60, 79), (83, 108)]
所以對于簡單粘連的情況,調整閾值也是可以解決的。
第二種方法,叫做CFS連通域分割法。原理就是假定每個字符都由一個單獨的連通域組成,換言之就是無粘連,找到一個黑色像素并開始判斷,直到所有相連的黑色像素都被遍歷標記過后即可判斷出這個字符的分割位置。算法如下:
代碼如下:
import queue def cfs(img): """傳入二值化后的圖片進行連通域分割""" pixdata = img.load() w,h = img.size visited = set() q = queue.Queue() offset = [(-1,-1),(0,-1),(1,-1),(-1,0),(1,0),(-1,1),(0,1),(1,1)] cuts = [] for x in range(w): for y in range(h): x_axis = [] #y_axis = [] if pixdata[x,y] == 0 and (x,y) not in visited: q.put((x,y)) visited.add((x,y)) while not q.empty(): x_p,y_p = q.get() for x_offset,y_offset in offset: x_c,y_c = x_p+x_offset,y_p+y_offset if (x_c,y_c) in visited: continue visited.add((x_c,y_c)) try: if pixdata[x_c,y_c] == 0: q.put((x_c,y_c)) x_axis.append(x_c) #y_axis.append(y_c) except: pass if x_axis: min_x,max_x = min(x_axis),max(x_axis) if max_x - min_x > 3: # 寬度小于3的認為是噪點,根據需要修改 cuts.append((min_x,max_x)) return cuts
調用后輸出結果和使用投影法是一樣的。另外我看網上還有一種叫做“泛洪填充(Flood Fill)”的方法,似乎和連通域是一樣的。
總結
以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,如果有疑問大家可以留言交流,謝謝大家對億速云的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。