91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

從圖像超分辨率快速入門pytorch

發布時間:2020-07-04 07:05:22 來源:網絡 閱讀:958 作者:nineteens 欄目:編程語言

  前言

  最近又開始把pytorch拾起來,學習了github上一些項目之后,發現每個人都會用不同的方式來寫深度學習的訓練代碼,而這些代碼對于初學者來說是難以閱讀的,因為關鍵和非關鍵代碼糅雜在一起,讓那些需要快速將代碼跑起來的初學者摸不著頭腦。

  所以,本文打算從最基本的出發,只寫關鍵代碼,將完成一次深度學習訓練需要哪些要素展現給各位初學者,以便你們能夠快速上手。等到能夠將自己的想法用最簡潔的方式寫出來并運行起來之后,再對自己的代碼進行重構、擴展。我認為這種學習方式是較好的循序漸進的學習方式。

  本文選擇超分辨率作為入門案例,一是因為通過結合案例能夠對訓練中涉及到的東西有較好的體會,二是超分辨率是較為簡單的任務,我們本次教程的目的是教會大家如何使用pytorch,所以不應該將難度設置在任務本身上。下面開始正文。。。

  正文

  單一圖像超分辨率(SISR)

  簡單介紹一下圖像超分辨率這一任務:超分辨率的任務就是將一張圖像的尺寸放大并且要求失真越小越好,舉例來說,我們需要將一張256*500的圖像放大2倍,那么放大后的圖像尺寸就應該是512*1000。用深度學習的方法,我們通常會先將圖像縮小成原來的1/2,然后以原始圖像作為標簽,進行訓練。訓練的目標是讓縮小后的圖像放大2倍后與原圖越近越好。所以通常會用L1或者L2作為損失函數。

  訓練4要素

  一次訓練要想完成,需要的要素我總結為4點:

  網絡模型

  數據

  損失函數

  優化器

  這4個對象都是一次訓練必不可少的,通常情況下,需要我們自定義的是前兩個:網絡模型和數據,而后面兩個較為統一,而且pytorch也提供了非常全面的實現供我們使用,它們分別在torch.nn包和torch.optim包下面,使用的時候可以到pytorch官網進行查看,后面我們用到的時候還會再次說明。

  網絡模型

  在網絡模型和數據兩個當中,網絡模型是比較簡單的,數據加載稍微麻煩些。我們先來看網絡模型的定義。自定義的網絡模型都必須繼承torch.nn.Module這個類,里面有兩個方法需要重寫:初始化方法__init__(self)和forward(self, *input)方法。在初始化方法中一般要寫我們需要哪些層(卷積層、全連接層等),而在forward方法中我們需要寫這些層的連接方式。舉一個通俗的例子,搭積木需要一個個的積木塊,這些積木塊放在__init__方法中,而規定將這些積木塊如何連接起來則是靠forward方法中的內容。

  import torch.nn as nn

  import torch.nn.functional as F

  class VDSR(nn.Module):

  def __init__(self):

  super(VDSR, self).__init__()

  self.conv1 = nn.Conv2d(1, 64, kernel_size=3, stride=1, padding=1, bias=True)

  self.conv2 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)

  self.conv3 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)

  self.conv4 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)

  self.conv5 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)

  self.conv6 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)

  self.conv7 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)

  self.conv8 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)

  self.conv9 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)

  self.conv10 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)

  self.conv11 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)

  self.conv12 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)

  self.conv13 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)

  self.conv14 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)

  self.conv15 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)

  self.conv16 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)

  self.conv17 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)

  self.conv18 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)

  self.conv19 = nn.Conv2d(64, 64, kernel_size=3, stride=1, padding=1, bias=True)

  self.conv20 = nn.Conv2d(64, 1, kernel_size=3, stride=1, padding=1, bias=True)

  def forward(self, x):

  ori = x

  x = F.relu(self.conv1(x))

  x = F.relu(self.conv2(x))

  x = F.relu(self.conv3(x))

  x = F.relu(self.conv4(x))

  x = F.relu(self.conv5(x))

  x = F.relu(self.conv6(x))

  x = F.relu(self.conv7(x))

  x = F.relu(self.conv8(x))

  x = F.relu(self.conv9(x))

  x = F.relu(self.conv10(x))

  x = F.relu(self.conv11(x))

  x = F.relu(self.conv12(x))

  x = F.relu(self.conv13(x))

  x = F.relu(self.conv14(x))

  x = F.relu(self.conv15(x))

  x = F.relu(self.conv16(x))

  x = F.relu(self.conv17(x))

  x = F.relu(self.conv18(x))

  x = F.relu(self.conv19(x))

  x = self.conv20(x)

  return x + ori

  上面代碼中展示的是我們要用到的模型VDSR,這個模型很簡單,就是連續的20層卷積,外加一個跳線連接。結構圖如下:

  在寫網絡模型時,用到的各個層都在torch.nn這個包中,在寫自定義的網絡結構時可以自行到pytorch官網的文檔中進行查看。

  數據

  定義了網絡模型之后,我們再來看“數據”。“數據”主要涉及到Dataset和DataLoader兩個概念。

  Dataset是數據加載的基礎,我們一般在加載自己的數據集時都需要自定義一個Dataset,自定義的Dataset都需要繼承torch.utils.data.Dataset這個類,當實現了__getitem__()和__len__()這兩個方法后,我們就自定義了一個Map-style datasets,Dataset是一個可迭代對象,通過下標訪問的方式就能夠調用__getitem__()方法來實現數據加載。

  這里面最關鍵的就算是__getitem__()如何來寫了,我們需要讓__getitem__()的返回值是一對,包括圖像和它的label,這里我們的任務是超分辨率,那么圖像和label分別是經過下采樣的圖像和與其對應的原始圖像。所以我們Dataset的__getitem__()方法返回值就應該是兩個3D Tensor,分別表示兩種圖像。

  這里需要重點說明一下__getitem__()方法的返回值為什么應該是3D Tensor。根據pytorch官網的說法,二維卷積層只接受4D Tensor,它的每一維表示的內容分別是nSamples x nChannels x Height x Width,我們最后需要用批量的方式將數據送到網絡中,所以__getitem__()方法的返回值就應該是后面三維的內容,即便是我們的通道數為1,也必須有這一維的存在,否則就會報錯。后面代碼中用到的unsqueeze(0)方法的作用就是如此。前面是說了為什么應該是3D的,為什么應該是Tensor呢?Tensor是跟NumPy中ndarray類似的東西,只是它能夠被用于GPU中來加速計算。

  下面來看一下我們的代碼:

  import os

  import random

  import cv2

  import torch

  from torch.utils.data import Dataset

  patch_size = 64

  def getPatch(y):

  h, w = y.shape

  randh = random.randrange(0, h - patch_size + 1)

  randw = random.randrange(0, w - patch_size + 1)

  lab = y[randh:randh + patch_size, randw:randw + patch_size]

  resized = cv2.resize(lab, None, fx=0.5, fy=0.5, interpolation=cv2.INTER_CUBIC)

  rresized = cv2.resize(resized, None, fx=2, fy=2, interpolation=cv2.INTER_CUBIC)

  return rresized, lab

  class MyDateSet(Dataset):

  def __init__(self, imageFolder):

  self.imageFolder = imageFolder

  self.images = os.listdir(imageFolder)

  def __len__(self):

  return len(self.images)

  def __getitem__(self, index):

  name = self.images[index]

  name = os.path.join(self.imageFolder, name)

  imread = cv2.imread(name)

  # 轉換顏色空間

  ycrcb = cv2.cvtColor(imread, cv2.COLOR_RGB2YCR_CB)

  # 提取y通道

  y = ycrcb[:, :, 0]

  # 裁剪成小塊

  img, lab = getPatch(y)

  # 轉為3D Tensor鄭州婦科醫院 http://www.sptdfk.com/

  return torch.from_numpy(img).unsqueeze(0), torch.from_numpy(lab).unsqueeze(0)

  其中MyDateSet的內容也不長,包括了初始化方法、__getitem__()和__len__()兩個方法。__getitem__()有一個輸入值是下標值,我們根據下標,利用OpenCV,讀取了圖像,并將其轉換顏色空間,超分訓練的時候我們只用了其中的y通道。還對圖形進行了裁剪,最后返回了兩個3D Tensor。

  在寫自定義數據集的時候,我們最需要關注的點就是__getitem__()方法的返回值是不是符合要求,能不能夠被送到網絡中去。至于中間該怎么操作,其實跟pytorch框架也沒什么關系,根據需要來做。

  訓練

  寫好了Dataset之后,我們就能夠通過下標的方式獲取圖像以及它的label。但是離開始訓練還有兩個要素:損失函數和優化器。前面我們也說了,這兩部分,pytorch官方提供了大量的實現,多數情況下不需要我們自己來自定義,這里我們直接使用了提供的torch.nn.MSELoss(size_average=None, reduce=None, reduction='mean')作為損失函數和torch.optim.Adam(params, lr=0.001, betas=(0.9, 0.999), eps=1e-08, weight_decay=0, amsgrad=False)作為優化器。

  訓練示例代碼:

  import torch

  import torch.nn as nn

  import torch.optim as optim

  import date

  import model

  date_set = date.MyDateSet("Train/")

  model = model.VDSR()

  device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

  model.to(device)

  mse_loss = nn.MSELoss()

  adam = optim.Adam(model.parameters())

  for epoch in range(100):

  running_loss = 0.0

  for i in range(len(date_set)):

  rresized, y = date_set[i]

  adam.zero_grad()

  out = model(rresized.unsqueeze(0).to(device, torch.float))

  loss = mse_loss(out, y.unsqueeze(0).to(device, torch.float))

  loss.backward()

  adam.step()

  running_loss += loss

  if i % 100 == 99: # print every 100

  print('[%d, %5d] loss: %.3f' %

  (epoch + 1, i + 1, running_loss / 100))

  running_loss = 0.0

  print('Finished Training')

  整個訓練代碼非常簡潔,只有短短幾行,定義模型、將模型移至GPU、定義損失函數、定義優化器(模型移動至GPU一定要在定義優化器之前,因為移動前后的模型已經不是同一個模型對象)。

  訓練時,先用zero_grad()來將上一次的梯度清零,然后將數據輸入網絡,求誤差,誤差反向傳播求每個requires_grad=True的Tensor(也就是網絡權重)的梯度,根據優化規則對網絡權重值進行更新,在一次次的更新迭代中,網絡朝著loss降低的方向變化著。

  值的注意的是,圖像數據也需要移動至GPU,并且需要將其類型轉換為與網絡模型的權重相同的torch.float

  DataLoader

  到前面為止,其實已經能夠實現訓練的過程了,但是,通常情況下,我們都需要:

  將數據打包成一個批量送入網絡

  每次隨機將數據打亂送入網絡

  用多線程的方式加載數據(這樣能夠提升數據加載速度)

  這些事情不需要我們自己實現,有torch.utils.data.DataLoader來幫我們實現。完整聲明如下:

  torch.utils.data.DataLoader(dataset, batch_size=1, shuffle=False, sampler=None, batch_sampler=None, num_workers=0, collate_fn=None, pin_memory=False, drop_last=False, timeout=0, worker_init_fn=None, multiprocessing_context=None)

  其中的sampler、batch_sampler、collate_fn都是可以有自定義實現的。我們簡單的使用默認的實現來構造DataLoader。使用了DataLoader之后的訓練代碼稍微有些不同,其中也添加了保存模型的代碼(只保存參數的方式):

  import torch

  import torch.nn as nn

  import torch.optim as optim

  from torch.utils.data import DataLoader

  import date

  import model

  date_set = date.MyDateSet("Train/")

  dataloader = DataLoader(date_set, batch_size=128,

  shuffle=True, drop_last=True)

  model = model.VDSR()

  device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

  model.to(device)

  mse_loss = nn.MSELoss()

  adam = optim.Adam(model.parameters())

  def train():

  for epoch in range(1000):

  running_loss = 0.0

  for i, images in enumerate(dataloader):

  rresized, y = images

  adam.zero_grad()

  out = model(rresized.to(device, torch.float))

  loss = mse_loss(out, y.to(device, torch.float))

  loss.backward()

  adam.step()

  running_loss += loss

  if epoch % 10 == 9:

  PATH = './trainedModel/net_' + str(epoch + 1) + '.pth'

  torch.save(model.state_dict(), PATH)

  print('[%d] loss: %.3f' %

  (epoch + 1, running_loss / 3))

  print('Finished Training')

  if __name__ == '__main__':

  train()


向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

金寨县| 冀州市| 措勤县| 墨竹工卡县| 石棉县| 新和县| 沙雅县| 金昌市| 定襄县| 天柱县| 遂昌县| 汉阴县| 兰溪市| 潼关县| 岢岚县| 林口县| 当阳市| 连平县| 仁寿县| 阜城县| 安新县| 东乡族自治县| 乐山市| 天全县| 青铜峡市| 宁城县| 永年县| 栾城县| 清河县| 加查县| 南木林县| 沁阳市| 保定市| 铜川市| 桦川县| 思茅市| 济源市| 西藏| 泰顺县| 桃园县| 通河县|