91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python中如何使用CIFAR10數據集

發布時間:2023-02-03 09:27:01 來源:億速云 閱讀:138 作者:iii 欄目:開發技術

這篇“python中如何使用CIFAR10數據集”文章的知識點大部分人都不太理解,所以小編給大家總結了以下內容,內容詳細,步驟清晰,具有一定的借鑒價值,希望大家閱讀完這篇文章能有所收獲,下面我們一起來看看這篇“python中如何使用CIFAR10數據集”文章吧。

    關于CIFAR10數據集的使用

    主要解決了如何把數據集與transforms結合在一起的問題。

    CIFAR10的官方解釋

    torchvision.datasets.CIFAR10(
    root: str, 
    train: bool = True, 
    transform: Optional[Callable] = None,
    target_transform: Optional[Callable] = None,
    download: bool = False)

    注釋:

    • root (string)存在 cifar-10-batches-py 目錄的數據集的根目錄,如果下載設置為 True,則將保存到該目錄。

    • train (bool, optional)如果為True,則從訓練集創建數據集, 如果為False,從測試集創建數據集。

    • transform (callable, optional)它接受一個 PIL 圖像并返回一個轉換后的版本。 例如,transforms.RandomCrop/transforms.ToTensor

    • target_transform (callable, optional) 接收目標并對其進行轉換的函數/轉換。

    • download (bool, optional)如果為 true,則從 Internet 下載數據集并將其放在根目錄中。 如果數據集已經下載,則不會再次下載。

    實戰操作

    1.CIAFR10數據集的下載

    代碼如下:

    import torchvision   #導入torchvision這個類
    
    train_set = torchvision.datasets.CIFAR10(root = "./dataset", train = True, 
    download= True)  #從訓練集創建數據集
    test_set = torchvision.datasets.CIFAR10(root="./dataset", train=False,
     download=True)    #從測試集創建數據集

    root = "./dataset",將下載的數據集保存在這個文件夾下;download= True,從 Internet 下載數據集并將其放在根目錄中,這里就是在相對路徑中,創建dataset文件夾,將數據集保存在dataset中。

    2.查看下載的CIAFR10數據集

    運行程序,開始下載數據集。下載成功后,可以進行一些查看。代碼如下:

    接著輸入:

    print(train_set[0])  #查看train_set訓練集中的第一個數據
    print(train_set.classes)   #查看train_set訓練集中有多少個類別
     
    img, target = train_set[0]
    print(img)
    print(target)
    print(train_set.classes[target])
    img.show()  #顯示圖片

    輸出結果:

    (<PIL.Image.Image image mode=RGB size=32x32 at 0x161E924B8D0>, 6)
    ['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship',
    'truck']
    <PIL.Image.Image image mode=RGB size=32x32 at 0x161E924B710>
    6
    frog

    注釋:可以看見,train_set數據集中有10個類別,train_set中第0個元素的target是6,也就是說,這個元素是屬于第7個類別frog的。

    3.數據轉換

    因為這些圖片類型都是PIL Image,如果要供給pytorch使用的話,需要將數據全都轉化成tensor類型。

    完整代碼如下:

    import torchvision   #導入torchvision這個類
    from torch.utils.tensorboard import SummaryWriter
    
    from torchvision import transforms
    dataset_transforms = transforms.ToTensor()
    
    # dataset_transforms = torchvision.transforms.Compose([
    #     torchvision.transforms.ToTensor()
    # ])    第3  4 行代碼可以用compose直接寫
    train_set = torchvision.datasets.CIFAR10(root = "./dataset", train = True, transform=dataset_transforms, download= True) #訓練集
    test_set = torchvision.datasets.CIFAR10(root="./dataset", train=False, transform=dataset_transforms, download=True)   #測試集
    
    writer = SummaryWriter("logs")
    
    # print(train_set[0])  #查看train_set訓練集中的第一個數據
    # print(train_set.classes)   #查看train_set訓練集中有多少個類別
    
    # img, target = train_set[0]
    # print(img)
    # print(target)
    # print(train_set.classes[target])
    # img.show()
    for i in range(20):
        img, target = train_set[i]
        writer.add_image("cifar10_test2", img, i)
    
    writer.close()

    小結:CIFAR10數據集內存很小,只有100多m,下載方便。對我們學習數據集非常友好,練習的時候,我們可以使用SummaryWriter來將數據寫入tensorboard中。

    CIFAR-10 數據集簡介

    復現代碼的過程中,簡單了解了作者使用的數據集CIFAR-10 dataset ,簡單記錄一下。

    CIFAR-10數據集是8000萬微小圖片的標簽子集,它的收集者是:Alex Krizhevsky, Vinod Nair, Geoffrey Hinton。

    數據集由6萬張32*32的彩色圖片組成,一共有10個類別。每個類別6000張圖片。其中有5萬張訓練圖片及1萬張測試圖片。

    數據集被劃分為5個訓練塊和1個測試塊,每個塊1萬張圖片。

    測試塊包含了1000張從每個類別中隨機選擇的圖片。訓練塊包含隨機的剩余圖像,但某些訓練塊可能對于一個類別的包含多于其他類別,訓練塊包含來自各個類別的5000張圖片。

    這些類是完全互斥的,及在一個類別中出現的圖片不會出現在其它類中。

    數據集版本

    作者提供了3個版本的數據集:python version; Matlab version; binary version。

    可根據自己的需求選擇。

    數據集布置

    以python version進行介紹,Matlab version與之相同。

    下載后獲得文件 data_batch_1, data_batch_2,&hellip;, data_batch_5。測試塊相同。這些文件中的每一個都是用cPickle生成的python pickled對象。

    具體使用方法:

    def unpickle(file):
        import pickle
        with open(file, 'rb') as fo:
            dict = pickle.load(fo, encoding='bytes')
        return dict

    返回字典類,每個塊的文件包含一個字典類,包含以下元素:

    • data: 一個100003072的numpy數組(unit8)每個行存儲3232的彩色圖片,3072=1024*3,分別是red, green, blue。存儲方式以行為主。

    • labels:使用0-9進行索引。

    數據集包含的另一個文件batches.meta同樣包含python字典,用于加載label_names。如:label_names[0] == “airplane”, label_names[1] == “automobile”

    以上就是關于“python中如何使用CIFAR10數據集”這篇文章的內容,相信大家都有了一定的了解,希望小編分享的內容對大家有幫助,若想了解更多相關的知識內容,請關注億速云行業資訊頻道。

    向AI問一下細節

    免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

    AI

    汝南县| 杂多县| 岑巩县| 长兴县| 永定县| 永丰县| 武隆县| 乐清市| 泸水县| 深圳市| 六枝特区| 贵阳市| 金塔县| 武夷山市| 菏泽市| 吴川市| 湛江市| 龙江县| 泸溪县| 富平县| 石狮市| 西吉县| 榆中县| 青冈县| 金门县| 龙岩市| 阿巴嘎旗| 霍邱县| 绍兴市| 兴隆县| 和田市| 灵石县| 会昌县| 固镇县| 浦北县| 元谋县| 黎城县| 张家界市| 德阳市| 宁陕县| 四平市|