您好,登錄后才能下訂單哦!
NumPy
什么是NumPy
NumPy是 Python 語言的一個擴展程序庫,支持大量的維度數組與矩陣運算,此外也針對數組運算提供大量的數學函數庫。主頁為https://numpy.org/。
安裝NumPy
使用pip工具來安裝。
python -m pip install numpy
使用NumPy讀取mnist數據
如果直接從網絡上讀取mnist數據,恭喜你,目前國內基本需要一個小時以上。所以建議預先下載mnist數據包。
工作環境
當前我的工作環境如下:Win10 + Anaconda。使用Spyder4做為IDE。Anaconda的安裝可以參考我的blog。
將數據放置到指定目錄
下圖是我當前的工作目錄環境,因此在C:\Users\sus20\.spyder-py3-dev目錄下,建立子目錄minist。如下圖所示:
將下載好的四個gz文件拷貝到這個目錄下,并將這四個gz文件解壓。如下圖所示:
使用NumPy讀取MNIST
load_mnist 函數返回兩個數組,第一個是一個 n * m 維的 NumPy array(images),這里的 n 是樣本行數,m 是特征列數。訓練數據集包含 60,000 個樣本,測試數據集包含 10,000 樣本。
在 MNIST 數據集中的每張圖片由 28 * 28 個像素點構成,每個像素點用一個灰度值表示。在這里,我們將 28 * 28 的像素展開為一個一維的行向量,這些行向量就是圖片數組里的行(每行 784 個值, 或者說每行就是代表了一張圖片)。
load_mnist 函數返回的第二個數組(labels) 包含了相應的目標變量,也就是手寫數字的類標簽(整數 0-9)。
import os import struct import numpy as np def load_mnist(path, kind='train'): """Load MNIST data from `path`""" labels_path = os.path.join(path,'%s-labels-idx1-ubyte'% kind) images_path = os.path.join(path,'%s-images-idx3-ubyte'% kind) with open(labels_path, 'rb') as lbpath: magic, n = struct.unpack('>II',lbpath.read(8)) labels = np.fromfile(lbpath,dtype=np.uint8) #讀入magic是一個文件協議的描述,也是調用fromfile 方法將字節讀入NumPy的array之前在文件緩沖中的item數(n). with open(images_path, 'rb') as imgpath: magic, num, rows, cols = struct.unpack('>IIII',imgpath.read(16)) images = np.fromfile(imgpath,dtype=np.uint8).reshape(len(labels), 784) return images, labels print(load_mnist("minst_data"))
運行代碼,將得到如下圖結果,說明我們已經正確的從本地讀取MNIST數據集。
下一步,我們要開始使用TensorFlow讀取MNIST數據集。
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持億速云。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。