91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

python怎么對文本進行詞頻統計

小億
123
2024-01-03 18:55:13
欄目: 編程語言

使用Python對文本進行詞頻統計可以使用下面的步驟:

  1. 打開文本文件并讀取文本內容。
with open("text.txt", "r") as file:
    text = file.read()
  1. 對文本進行分詞。
import re

# 去除標點符號和空白字符
text = re.sub(r'[^\w\s]', '', text)

# 將文本拆分為單詞列表
words = text.split()
  1. 統計每個單詞的出現次數。
from collections import Counter

word_count = Counter(words)
  1. 排序并輸出詞頻結果。
for word, count in word_count.most_common():
    print(word, count)

完整的代碼如下:

import re
from collections import Counter

with open("text.txt", "r") as file:
    text = file.read()

text = re.sub(r'[^\w\s]', '', text)
words = text.split()
word_count = Counter(words)

for word, count in word_count.most_common():
    print(word, count)

請確保將代碼中的"text.txt"替換為實際的文本文件路徑。

0
南阳市| 林芝县| 鹿泉市| 平罗县| 徐州市| 金阳县| 普宁市| 佳木斯市| 灵丘县| 沐川县| 阳东县| 巩义市| 前郭尔| 扎兰屯市| 玛纳斯县| 蛟河市| 茌平县| 金阳县| 泽库县| 南安市| 贺州市| 綦江县| 措勤县| 墨竹工卡县| 武威市| 页游| 伊通| 米林县| 潼南县| 砀山县| 奈曼旗| 怀来县| 天峻县| 鄂州市| 密山市| 南充市| 尚志市| 邵东县| 鄯善县| 调兵山市| 福贡县|