您好,登錄后才能下訂單哦!
卷積在pytorch中有兩種實現,一種是torch.nn.Conv2d(),一種是torch.nn.functional.conv2d(),這兩種方式本質都是執行卷積操作,對輸入的要求也是一樣的,首先需要輸入的是一個torch.autograd.Variable()的類型,大小是(batch,channel, H,W),其中batch表示輸入的一批數據的數目,channel表示輸入的通道數。
一般一張彩色的圖片是3,灰度圖片是1,而卷積網絡過程中的通道數比較大,會出現幾十到幾百的通道數。H和W表示輸入圖片的高度和寬度,比如一個batch是32張圖片,每張圖片是3通道,高和寬分別是50和100,那么輸入的大小就是(32,3,50,100)。
如下代碼是卷積執行soble邊緣檢測算子的實現:
import torch import numpy as np from torch import nn from PIL import Image from torch.autograd import Variable import torch.nn.functional as F def nn_conv2d(im): # 用nn.Conv2d定義卷積操作 conv_op = nn.Conv2d(1, 1, 3, bias=False) # 定義sobel算子參數 sobel_kernel = np.array([[-1, -1, -1], [-1, 8, -1], [-1, -1, -1]], dtype='float32') # 將sobel算子轉換為適配卷積操作的卷積核 sobel_kernel = sobel_kernel.reshape((1, 1, 3, 3)) # 給卷積操作的卷積核賦值 conv_op.weight.data = torch.from_numpy(sobel_kernel) # 對圖像進行卷積操作 edge_detect = conv_op(Variable(im)) # 將輸出轉換為圖片格式 edge_detect = edge_detect.squeeze().detach().numpy() return edge_detect def functional_conv2d(im): sobel_kernel = np.array([[-1, -1, -1], [-1, 8, -1], [-1, -1, -1]], dtype='float32') # sobel_kernel = sobel_kernel.reshape((1, 1, 3, 3)) weight = Variable(torch.from_numpy(sobel_kernel)) edge_detect = F.conv2d(Variable(im), weight) edge_detect = edge_detect.squeeze().detach().numpy() return edge_detect def main(): # 讀入一張圖片,并轉換為灰度圖 im = Image.open('./cat.jpg').convert('L') # 將圖片數據轉換為矩陣 im = np.array(im, dtype='float32') # 將圖片矩陣轉換為pytorch tensor,并適配卷積輸入的要求 im = torch.from_numpy(im.reshape((1, 1, im.shape[0], im.shape[1]))) # 邊緣檢測操作 # edge_detect = nn_conv2d(im) edge_detect = functional_conv2d(im) # 將array數據轉換為image im = Image.fromarray(edge_detect) # image數據轉換為灰度模式 im = im.convert('L') # 保存圖片 im.save('edge.jpg', quality=95) if __name__ == "__main__": main()
原圖片:cat.jpg
結果圖片:edge.jpg
以上這篇Pytorch 實現sobel算子的卷積操作詳解就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持億速云。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。