91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python中如何Pandas代碼助數據從業人員開啟新征程

發布時間:2021-10-26 10:36:22 來源:億速云 閱讀:174 作者:柒染 欄目:編程語言

這期內容當中小編將會給大家帶來有關Python中如何Pandas代碼助數據從業人員開啟新征程,文章內容豐富且以專業的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

摘要

Pandas 是基于NumPy 的一種工具,該工具是為了解決數據分析任務而創建的。不少利用Python做數據分析的朋友應該對Pandas不陌生,這里給大家總結了20個常用的Pandas代碼幫助大家更快速的理解數據。

我這里將這20個Pandas代碼分成三類:

  • 基本數據信息

  • 基本數據處理

  • 操作Data frames

基本數據信息

1、基本讀寫數據集(CSV、Execl)

# csv
# 讀
pd.DataFrame.from_csv(“csv_file”) 
pd.read_csv(“csv_file”)
# 寫
df.to_csv("data.csv", sep=",", index=False) # 逗號分隔,沒有下標
# execl
pd.read_excel("excel_file")
df.to_execl("data.xlsx",sheet_name='a')

2、基本數據集特征

df.info()

3、基本數據統計

df.describe()

4、將data frames輸出到一張表里(tabulate模塊)

from tabulate import tabulate
print(tabulate(print_table, headers=headers))
# print_table 為包含列表的列表
# headers 為表頭所包含的字段

5、列出所有的字段

df.columns

6、得到前后n行

df.head(n) #前n行
df.tail(n) #后n行

7、通過特征、位置定位數據

df.loc[feature_name]
#選擇“size”列的第一行
df.loc([0], ['size'])
df.iloc[n] # 位置

基本數據處理

8、去除缺失值

df.dropna(axis=0, how='any')

9、替換缺失值

df.replace(to_replace=None, value=None)
# 將“to_replace”中的值替換為“value”

10、檢查缺失值

pd.isnull(object)
# 檢測缺失值(數值數組中的NaN,對象數組中的None/NaN)

11、刪除一個字段

df.drop('feature_variable_name', axis=1)
# 軸對于行是0,對于列是1

12、將對象類型轉換為數值

pd.to_numeric(df["feature_name"], errors='coerce')
# 將對象類型轉換為numeric以便能夠執行計算(如果它們是字符串)

13、將Dataframe轉換為numpy數組

df.as_matrix()

操作Data frames

14、將函數應用于dataframe

# 這個將把數據的“height”列中的所有值乘以2
1、df["height"].apply(lambda height: 2 * height)
2、def multiply(x):
 return x * 2
df["height"].apply(multiply)

15、從命名一列

# 這里,將把數據的第三列重命名為“size”
df.rename(columns = {df.columns[2]:'size'}, inplace=True)

16、獲取某列的唯一項

# 這里將得到列“name”的唯一條目
df["name"].unique()

17、多級訪問

# 在這里,將從數據中獲取列的選擇,“name”和“size”
new_df = df[["name", "size"]]

18、數據的一些統計量df.sum()

df.min()
df.max()
df.idxmin()
df.idxmax() #返回最大值索引
df.mean()
df.median()
df.corr() # 不同列之間的相關系數
df["size"].median

19、 數據排序

df.sort_values(ascending = False)

20、布爾索引

df[df["size"] == 5] #布爾型索引

上述就是小編為大家分享的Python中如何Pandas代碼助數據從業人員開啟新征程了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關知識,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

尚志市| 通州市| 弋阳县| 自贡市| 黎平县| 志丹县| 周口市| 余江县| 开鲁县| 南和县| 龙陵县| 桦南县| 马边| 惠东县| 进贤县| 罗城| 孟津县| 德昌县| 镇康县| 屯留县| 颍上县| 内江市| 奇台县| 绥芬河市| 寿宁县| 邵阳县| 龙门县| 商城县| 丁青县| 英山县| 镇坪县| 阿克陶县| 同江市| 台北市| 澎湖县| 双江| 凤冈县| 高州市| 临沭县| 黎城县| 新郑市|