在spaCy中,可以使用evaluate()
方法來評估文本分類器的性能。該方法需要傳入一個可迭代的樣本集,其中每個樣本是一個元組,包含文本和標簽。然后,該方法會返回一個包含性能指標的字典,包括準確率(accuracy)、精確率(precision)、召回率(recall)、F1值等。
下面是一個示例代碼,演示如何使用evaluate()
方法評估文本分類器的性能:
import spacy
# 加載spaCy模型
nlp = spacy.load("en_core_web_sm")
# 準備樣本集
test_samples = [
("This is a great movie", "POSITIVE"),
("I did not like this book", "NEGATIVE"),
("The weather is nice today", "NEUTRAL")
]
# 加載分類器
textcat = nlp.get_pipe("textcat")
# 評估性能
evaluation_results = textcat.evaluate(test_samples)
print(evaluation_results)
運行該代碼后,將會輸出包含性能指標的字典,可以根據這些指標來評估文本分類器的性能。