您好,登錄后才能下訂單哦!
在Python中,我們可以使用split()
函數來提取字符串中的單詞,并使用collections
模塊中的Counter
類來進行詞頻統計。以下是一個示例:
from collections import Counter
def extract_words(text):
words = text.split()
return words
def count_word_frequencies(words):
word_frequencies = Counter(words)
return word_frequencies
text = "hello world hello this is a test hello world"
words = extract_words(text)
word_frequencies = count_word_frequencies(words)
print("Words:", words)
print("Word Frequencies:", word_frequencies)
輸出:
Words: ['hello', 'world', 'hello', 'this', 'is', 'a', 'test', 'hello', 'world']
Word Frequencies: Counter({'hello': 3, 'world': 2, 'this': 1, 'is': 1, 'a': 1, 'test': 1})
在這個示例中,我們首先定義了一個名為extract_words
的函數,它接受一個字符串參數text
,并使用split()
函數將其拆分為單詞列表。然后,我們定義了一個名為count_word_frequencies
的函數,它接受一個單詞列表參數words
,并使用Counter
類統計每個單詞出現的次數。最后,我們使用這兩個函數提取文本中的單詞并統計它們的詞頻,然后將結果打印出來。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。