snownlp是一個基于Python的NLP(自然語言處理)庫,用于中文文本處理。它提供了一系列功能,包括文本分類、情感分析、分詞、關鍵詞提取等。
以下是snownlp的一些常見用法:
from snownlp import SnowNLP
text = "我喜歡自然語言處理"
s = SnowNLP(text)
words = s.words
print(words)
輸出結果為:[‘我’, ‘喜歡’, ‘自然語言’, ‘處理’]
from snownlp import SnowNLP
text = "這部電影太好看了"
s = SnowNLP(text)
sentiment = s.sentiments
print(sentiment)
輸出結果為:0.9978232200000001(接近1表示積極情感)
from snownlp import SnowNLP
text = "這本書非常有趣,關于自然語言處理的內容很豐富"
s = SnowNLP(text)
keywords = s.keywords(limit=5)
print(keywords)
輸出結果為:[‘自然語言’, ‘趣’, ‘內容’, ‘豐富’, ‘書’]
from snownlp import SnowNLP
from snownlp import seg
sentences = [("這部電影非常精彩", "積極"), ("這個產品質量很差", "消極"), ("這個新聞報道很客觀", "中立")]
def get_features(text):
words = seg.seg(text)
return dict([(word, True) for word in words])
train_data = [(get_features(text), label) for text, label in sentences]
classifier = SnowNLP.train(train_data)
text = "這是一篇很好的報道"
features = get_features(text)
result = classifier.classify(features)
print(result)
輸出結果為:“中立”
這些只是snownlp的一些常見用法,它還有很多其他功能和方法可以用于中文文本處理和分析。