您好,登錄后才能下訂單哦!
使用python與caffe怎么改變通道順序?相信很多沒有經驗的人對此束手無策,為此本文總結了問題出現的原因和解決方法,通過這篇文章希望你能解決這個問題。
把通道放在前面:
image = cv2.imread(path + file) image = cv2.resize(image, (48, 48), interpolation=cv2.INTER_CUBIC) aaaa= np.transpose(image,(2, 0, 1)) print(aaaa)
圖像原來shape:(48, 48, 3),改之后shape:(3,48,48)
注意:reshape不能解決通道轉換問題
pycaffe做識別時通道轉換問題:
要注意一點的就是:Caffe中彩色圖像的通道是BGR格式,圖像存儲是【0,255】
1.caffe.io.load_image方式 view plai cop
image = caffe.io.load_image(image_file) #加載圖片
使用caffe.io.load_image()讀進來的是RGB格式和0~1(float)
所以在進行識別之前要在transformer中設置transformer.set_raw_scale('data',255)(縮放至0~255)
以及transformer.set_channel_swap('data',(2,1,0)(將RGB變換到BGR)
# python中將圖片存儲為[0, 1],而caffe中將圖片存儲為[0, 255],所以需要一個轉換 transformer.set_raw_scale('data', 255) # 縮放到[0,255]之間 transformer.set_channel_swap('data', (2,1,0)) #交換通道,將圖片由RGB變為BGR(caffe中圖片是BGR格式,而原始格式是RGB,所以要轉化)
2.使用cv2.imread()來讀取圖片
cv2.imread()接口讀圖像,讀進來直接是BGR 格式and 0~255
所以不需要再縮放到【0,255】和通道變換【2,1,0】,不需要transformer.set_raw_scale('data',255)和transformer.set_channel_swap('data',(2,1,0))
3.使用PIL來讀取圖片
對于彩色圖像,不管其圖像格式是PNG,還是BMP,或者JPG,在PIL中,使用Image模塊的open()函數打開后,返回的圖像對象的模式都是“RGB”。而對于灰度圖像,不管其圖像格式是PNG,還是BMP,或者JPG,打開后,其模式為“L”。所以需要轉換格式,但不需要縮放到[0,255]
data = np.array(Image.open(self.dataRoot+img_list)) data = np.transpose(data,(2,0,1))#轉換通道 data[[0,2],...] = data[[2,0],...] #RGB→BGR
4.對于matlab來說
Caffe中的blobs格式是N*C*H*W,分別是數量Number,通道數Channel,以及寬度Height和寬度Width
而matlab中是先寬后高,即[w,h],圖像的通道是RGB
所以需要進行相應的轉換:
im_data = im (:,:,[3,2,1]) ; %RGB to BGR
im_data = permute(im_data, [2,1,3]); %旋轉高度和寬度
最后,分享一個Caffe的典型python識別代碼:
# -*- coding: utf-8 -*- """ Created on Sun May 28 16:00:47 2017 @author: fancp,#windows下CPU模式 """ import numpy as np import caffe import sys caffe_root = 'F:/Caffe' #########你自己的Caffe路徑 sys.path.insert(0, caffe_root + '/python') size = 227 #訓練的圖片尺寸 image_file = 'F:/.../.../nihao.jpg'#圖片路徑 model_def = 'F:/.../.../deploy.prototxt'#deploy模型文件位置 model_weights = 'F:/.../.../_iter_20000.caffemodel'#訓練完的模型位置 net = caffe.Net(model_def, model_weights, caffe.TEST) # 加載均值文件 mu = np.load(caffe_root + '/python/caffe/imagenet/ilsvrc_2012_mean.npy') ###caffe 自帶的文件 mu = mu.mean(1).mean(1) # average over pixels to obtain the mean (BGR) pixel values ###########################下面這5句等同與上面兩句,選擇其一################# #blob = caffe.proto.caffe_pb2.BlobProto() #mean_data = open( 'mean.binaryproto' , 'rb' ).read() #blob.ParseFromString(mean_data) #mu = np.array(caffe.io.blobproto_to_array(blob)) #mu = mu.mean(1).mean(1).mean(1) ############################################################################## #圖片預處理 transformer = caffe.io.Transformer({'data': net.blobs['data'].data.shape}) ##設定圖片的shape格式(1,3,227,227),大小由deploy 文件指定 # python讀取的圖片文件格式為H×W×K,需轉化為K×H×W transformer.set_transpose('data', (2,0,1)) #改變維度的順序,由原始圖片(227,227,3)變為(3,227,227) transformer.set_mean('data', mu) # 每個通道減去均值 # python中將圖片存儲為[0, 1],而caffe中將圖片存儲為[0, 255],所以需要一個轉換 transformer.set_raw_scale('data', 255) # 縮放到【0,255】之間 transformer.set_channel_swap('data', (2,1,0)) #交換通道,將圖片由RGB變為BGR(caffe中圖片是BGR格式,而原始格式是RGB,所以要轉化) net.blobs['data'].reshape(1,3,size, size) # 將輸入圖片格式轉化為合適格式(與deploy文件相同) #上面這句,第一參數:圖片數量 第二個參數 :通道數 第三個參數:圖片高度 第四個參數:圖片寬度 image = caffe.io.load_image(image_file) #加載圖片 # 用上面的transformer.preprocess來處理剛剛加載圖片 net.blobs['data'].data[...] = transformer.preprocess('data', image) ### perform classification caffe.set_mode_cpu() output = net.forward() #print output output_prob = output['prob'][0].argmax() # 給出概率最高的是第幾類,需要自己對應到我們約定的類別去
1、簡單易用,與C/C++、Java、C# 等傳統語言相比,Python對代碼格式的要求沒有那么嚴格;2、Python屬于開源的,所有人都可以看到源代碼,并且可以被移植在許多平臺上使用;3、Python面向對象,能夠支持面向過程編程,也支持面向對象編程;4、Python是一種解釋性語言,Python寫的程序不需要編譯成二進制代碼,可以直接從源代碼運行程序;5、Python功能強大,擁有的模塊眾多,基本能夠實現所有的常見功能。
看完上述內容,你們掌握使用python與caffe怎么改變通道順序的方法了嗎?如果還想學到更多技能或想了解更多相關內容,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。