在Python中,我們可以使用scipy.stats
庫中的CDF(累積分布函數)來進行統計推斷。首先,你需要確定你的數據分布類型,然后使用相應的分布函數來計算CDF值。以下是一個使用正態分布(高斯分布)的例子:
import numpy as np
from scipy.stats import norm
# 假設我們有以下數據
data = [12, 8, 9, 13, 12, 9, 7, 10, 9, 11]
# 計算數據的均值和標準差
mean = np.mean(data)
std_dev = np.std(data)
# 使用正態分布的CDF函數
def normal_cdf(x, mean, std_dev):
return norm.cdf(x, loc=mean, scale=std_dev)
# 計算特定值的CDF
value = 10
cdf_value = normal_cdf(value, mean, std_dev)
print(f"CDF of {value} is {cdf_value:.4f}")
在這個例子中,我們首先導入了所需的庫,然后計算了數據的均值和標準差。接下來,我們定義了一個名為normal_cdf
的函數,該函數使用scipy.stats.norm.cdf()
方法計算給定值的CDF。最后,我們計算了特定值(例如10)的CDF,并將結果打印出來。
請注意,這個例子使用了正態分布。如果你的數據遵循其他分布(如t分布、伽馬分布等),你需要使用相應的分布函數。在scipy.stats
庫中,你可以找到許多常見的統計分布函數。