您好,登錄后才能下訂單哦!
1、Pandas模塊
DataFrame提供的是一個類似表的結構,由多個Series組成,而Series在DataFrame中columns。
附: pandas模塊文檔
2、安裝IPython解釋器:
其實,一鍵安裝Anaconda可以幫助使用者,一次性配置好我所有需要的工具包以及IPython解釋器環境。但是,出于我想學習更加透徹,所以自己安裝工具包和IPython解釋器環境。
(1)因為,python在windows下通過pip安裝帶有c擴展的包時,如果是python2.7,需要vs2008,如果是 python 3.x,需要vs2010,版本錯了都不行(建議直接裝編譯好的安裝包:
http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml)。
但鏈接里沒有IPython,所以我用的方法是官網下載并安裝VCForPython27.msi。
然后在控制臺里輸入:
pip install ipython
pip install “ipython[notebook]”
進入ipynb文件所在目錄,輸入ipython notebook,會在瀏覽器中打開ipynb文件。
ipython notebook在下一個版本被命名為Jupyter Notebook。
通過pip install jupyter安裝
jupyter notebook運行
3、
使用plot()繪圖時,如果指定樣式參數為僅繪制數據點,那么所繪制的就是一幅散列圖。但是這種方法所繪制的點無法單獨指定顏色和大小。
scatter()所繪制的散列圖卻可以指定每個點的顏色和大小。
scatter()的前兩個參數是數組,分別指定每個點的X軸和Y軸的坐標。
s參數指定點的大 小,值和點的面積成正比。它可以是一個數,指定所有點的大小;也可以是數組,分別對每個點指定大小。
c參數指定每個點的顏色,可以是數值或數組。這里使用一維數組為每個點指定了一個數值。通過顏色映射表,每個數值都會與一個顏色相對應。默認的顏色映射表中藍色與最小值對應,紅色與最大值對應。當c參數是形狀為(N,3)或(N,4)的二維數組時,則直接表示每個點的RGB顏色。
marker參數設置點的形狀,可以是個表示形狀的字符串,也可以是表示多邊形的兩個元素的元組,第一個元素表示多邊形的邊數,第二個元素表示多邊形的樣式,取值范圍為0、1、2、3。0表示多邊形,1表示星形,2表示放射形,3表示忽略邊數而顯示為圓形。
alpha參數設置點的透明度。
lw參數設置線寬,lw是line width的縮寫。
facecolors參數為“none”時,表示散列點沒有填充色。
4、Sigmoid函數是一個在生物學中常見的S型的函數,也稱為S型生長曲線。
sigmoid函數是一個良好的閾值函數,連續,光滑,嚴格單調,關于(0,0.5)中心對稱。
http://blog.csdn.net/chl033/article/details/4851541
5、讀取 .csv 文件
#讀取 .csv 文件練習 import csv csvfile = file('csv_test.csv', 'wb') writer = csv.writer(csvfile) writer.writerow(['姓名', '年齡', '電話']) data = [ ('小河', '25', '1234567'), ('小芳', '18', '789456') ] writer.writerows(data) #csvfile.close() csvfile = file('csv_test.csv', 'rb') reader = csv.reader(csvfile) for line in reader: print line csvfile.close() ['\xe5\xa7\x93\xe5\x90\x8d', '\xe5\xb9\xb4\xe9\xbe\x84', '\xe7\x94\xb5\xe8\xaf\x9d'] ['\xe5\xb0\x8f\xe6\xb2\xb3', '25', '1234567'] ['\xe5\xb0\x8f\xe8\x8a\xb3', '18', '789456']
6、train_test_split(分割train與test數據)函數練習
>>> import numpy as np >>> from sklearn.model_selection import train_test_split >>> X, y = np.arange(10).reshape((5, 2)), range(5) >>> Xarray([[0, 1], [2, 3], [4, 5], [6, 7], [8, 9]]) >>> list(y) [0, 1, 2, 3, 4] >>> >>> X_train, X_test, y_train, y_test = train_test_split( X, y, test_size=0.33, random_state=42) >>> X_train array([[4, 5], [0, 1], [6, 7]]) >>> y_train [2, 0, 3] >>> X_test array([[2, 3], [8, 9]]) >>> y_test [1, 4]
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。