在Pandas中,可以使用groupby
方法來實現數據聚合。具體步驟如下:
groupby
方法對數據進行分組,根據需要聚合的列進行分組。sum()
、mean()
、count()
等。agg()
方法同時應用多種聚合函數。reset_index()
方法將分組后的數據重新設置索引。下面是一個簡單的示例:
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Alice', 'Bob', 'Alice'],
'Score': [85, 90, 88, 92, 87],
'Age': [25, 30, 25, 30, 25]}
df = pd.DataFrame(data)
# 按照Name列進行分組,并計算每個人的平均分和總分
grouped = df.groupby('Name').agg({'Score': ['mean', 'sum'], 'Age': 'count'})
grouped = grouped.reset_index()
print(grouped)
運行以上代碼,輸出結果如下:
Name Score Age
mean sum count
0 Alice 86.7 261 3
1 Bob 91.0 182 2