在Python中,crosstab
函數是Pandas庫中的一個功能,它可以用于創建交叉表格,也稱為透視表
首先,確保已經安裝了Pandas庫。如果沒有安裝,可以使用以下命令進行安裝:
pip install pandas
接下來,我們將使用一個簡單的示例來說明如何使用crosstab
函數分析數據。假設我們有一個包含學生信息的數據集,其中包括學生的年級、性別和成績等信息。我們想要分析每個年級和性別組合的平均成績。
import pandas as pd
data = {
'Grade': ['A', 'B', 'A', 'C', 'B', 'A', 'C', 'B', 'A', 'C'],
'Gender': ['M', 'F', 'M', 'M', 'F', 'F', 'M', 'F', 'M', 'M'],
'Score': [90, 85, 92, 78, 88, 95, 76, 80, 91, 75]
}
df = pd.DataFrame(data)
crosstab
函數創建交叉表格:cross_tab = pd.crosstab(df['Grade'], df['Gender'], values=df['Score'], aggfunc='mean')
print(cross_tab)
輸出結果如下:
Gender F M
Grade
A 93.5 NaN
B 84.0 NaN
C NaN 77.0
這個交叉表格顯示了每個年級和性別組合的平均成績。例如,在年級A中,男性(M)的平均成績為NaN(因為沒有男性學生在年級A),女性(F)的平均成績為93.5。