在Python中,可以使用groupby
方法來進行分組和聚合操作。
groupby
方法是pandas
庫中的一個函數,它可以將數據按照某個列或多個列的值進行分組。分組后,我們可以進行各種聚合操作,比如求和、求平均值、計數等。
以下是一個示例代碼,演示如何使用groupby
方法進行分組和聚合操作:
import pandas as pd
# 創建一個包含姓名、科目和分數的DataFrame
data = {'姓名': ['小明', '小紅', '小明', '小紅', '小明', '小紅'],
'科目': ['數學', '數學', '語文', '語文', '英語', '英語'],
'分數': [80, 90, 70, 85, 95, 88]}
df = pd.DataFrame(data)
# 按照姓名分組,并計算每個人的平均分數
result = df.groupby('姓名')['分數'].mean()
print(result)
輸出結果為:
姓名
小明 81.666667
小紅 87.666667
Name: 分數, dtype: float64
上述代碼中,我們使用groupby
方法按照姓名進行分組,然后使用mean
方法計算每個人的平均分數。最后,我們打印了結果。
除了mean
方法,groupby
方法還可以與其他聚合函數一起使用,比如sum
、max
、min
等。可以根據具體需求選擇適合的聚合函數進行操作。