91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python使用pandas抽樣訓練數據中某個類別實例

發布時間:2020-09-08 23:11:27 來源:腳本之家 閱讀:207 作者:Yan456jie 欄目:開發技術

廢話真的一句也不想多說,直接看代碼吧!

# -*- coding: utf-8 -*- 
 
import numpy 
from sklearn import metrics 
from sklearn.svm import LinearSVC 
from sklearn.naive_bayes import MultinomialNB 
from sklearn import linear_model 
from sklearn.datasets import load_iris 
from sklearn.cross_validation import train_test_split 
from sklearn.preprocessing import OneHotEncoder, StandardScaler 
from sklearn import cross_validation 
from sklearn import preprocessing 
import scipy as sp
from sklearn.linear_model import LogisticRegression
from sklearn.feature_selection import SelectKBest ,chi2
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
#import iris_data 
 
'''
creativeID,userID,positionID,clickTime,conversionTime,connectionType,
telecomsOperator,appPlatform,sitesetID,positionType,age,gender,
education,marriageStatus,haveBaby,hometown,residence,appID,appCategory,label
'''
 
 
def test():
 df = pd.read_table("/var/lib/mysql-files/data1.csv", sep=",")
 df1 = df[["connectionType","telecomsOperator","appPlatform","sitesetID",
    "positionType","age","gender","education","marriageStatus",
    "haveBaby","hometown","residence","appCategory","label"]]
 print df1["label"].value_counts()
 N_data = df1[df1["label"]==0]
 P_data = df1[df1["label"]==1]
 N_data = N_data.sample(n=P_data.shape[0], frac=None, replace=False, weights=None, random_state=2, axis=0)
 #print df1.loc[:,"label"]==0
 print P_data.shape
 print N_data.shape
 
 data = pd.concat([N_data,P_data])
 print data.shape
 data = data.sample(frac=1).reset_index(drop=True) 
 print data[["label"]]
 return

補充拓展:pandas實現對dataframe抽樣

隨機抽樣

import pandas as pd
#對dataframe隨機抽取2000個樣本
pd.sample(df, n=2000)

分層抽樣

利用sklean中的函數靈活進行抽樣

from sklearn.model_selection import train_test_split
#y是在X中的某一個屬性列
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, stratify=y)

以上這篇python使用pandas抽樣訓練數據中某個類別實例就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持億速云。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

开封县| 南丰县| 康马县| 黄骅市| 桦南县| 南召县| 阳江市| 遂平县| 浦城县| 信丰县| 大安市| 岱山县| 太谷县| 水富县| 新建县| 张北县| 冕宁县| 旌德县| 武功县| 息烽县| 鞍山市| 姚安县| 天台县| 湘潭县| 河津市| 大悟县| 萨嘎县| 黄浦区| 义马市| 桂林市| 遵义县| 蒙山县| 普格县| 汉川市| 通山县| 富宁县| 钟山县| 会理县| 恩施市| 翁牛特旗| 库伦旗|