Python 可以使用多種庫來處理表格數據,其中最流行的是 pandas 庫。
使用 pandas 可以讀取、處理和分析表格數據。下面是一些常見的操作:
read_csv()
函數來讀取 CSV 文件,也可以使用 read_excel()
函數來讀取 Excel 文件。import pandas as pd
# 讀取 CSV 文件
data = pd.read_csv('data.csv')
# 讀取 Excel 文件
data = pd.read_excel('data.xlsx')
head()
函數可以查看表格的前幾行數據,默認為前 5 行,也可以指定查看的行數。# 查看前 5 行數據
data.head()
# 查看前 10 行數據
data.head(10)
# 篩選某一列滿足條件的行
filtered_data = data[data['column_name'] > 10]
sort_values()
函數可以對表格數據進行排序,可以指定排序的列和排序的順序。# 按某一列進行升序排序
sorted_data = data.sort_values('column_name')
# 按某一列進行降序排序
sorted_data = data.sort_values('column_name', ascending=False)
describe()
函數可以對表格數據進行統計分析,包括計數、均值、標準差等。# 對數值列進行統計分析
data.describe()
# 刪除重復行
data.drop_duplicates()
# 填充缺失值
data.fillna(value)
# 計算列間的相關性
data.corr()
以上是一些常見的表格數據處理操作,使用 pandas 可以靈活處理各種復雜的表格數據。