在Scikit-learn中,可以使用RandomForestClassifier
類來實現隨機森林模型。以下是一個簡單的示例代碼:
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# 加載數據集
iris = load_iris()
X = iris.data
y = iris.target
# 劃分訓練集和測試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 創建隨機森林模型
rf = RandomForestClassifier(n_estimators=100, random_state=42)
# 在訓練集上訓練模型
rf.fit(X_train, y_train)
# 在測試集上進行預測
y_pred = rf.predict(X_test)
# 計算準確率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy: {:.2f}".format(accuracy))
在上面的代碼中,首先加載鳶尾花數據集,然后將數據集劃分為訓練集和測試集。接著創建一個包含100棵樹的隨機森林模型,并在訓練集上訓練該模型。最后在測試集上進行預測并計算準確率。
通過調整n_estimators
參數可以設置森林中樹的數量,可以通過調整其他參數來優化模型性能。Scikit-learn中提供了豐富的參數來調整隨機森林模型,可以根據具體情況進行調整。