您好,登錄后才能下訂單哦!
今天小編給大家分享一下Python怎么統計序列中元素的出現頻度的相關知識點,內容詳細,邏輯清晰,相信大部分人都還太了解這方面的知識,所以分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后有所收獲,下面我們一起來了解一下吧。
實際案例:
(1)某隨機序列[12, 5, 6, 4, 6, 5, 5, 7, ...]
中找到出現次數最高的3個元素,它們出現次數是多少?
(2)對某英文文章的單詞,進行詞頻統計,找到出現次數最高的10個單詞,它們出現次數是多少?
解決方案:
使用collections.Counter
對象
將序列傳入Counter
的構造器,得到Counter
對象是元素頻度的字典。
Counter.most_common(n)
方法得到頻度最高的n個元素的列表。
(1)某隨機序列 [12, 5, 6, 4, 6, 5, 5, 7, ...] 中找到出現次數最高的3個元素,它們出現次數是多少?
from random import randint # 利用列表解析生成隨機序列 data = [randint(0, 20) for _ in range(30)] print(data) # 方法1: ''' 最終的統計結果肯定是一個字典,如:{2: 5, 4:9}, 以data中每一個元素作為字典的鍵,0作為初始值,創建這樣一個字典 ''' c = dict.fromkeys(data, 0) print(c) # 對data進行迭代,進行統計 for x in data: c[x] += 1 print(c) # 根據字典的值對字典項進行排序,并截取前3個元素 sort_dict = sorted(c.items(), key=lambda item: item[1], reverse=True)[0:3] print(sort_dict) # 方法2: from collections import Counter # 直接將序列傳給Counter構造器 c2 = Counter(data) print(c2) # 直接使用對象的most_common()方法直接找到頻度最高3個 print(c2.most_common(3))
(2)對某英文文章的單詞,進行詞頻統計,找到出現次數最高的10個單詞,它們出現次數是多少?
from collections import Counter # 導入正則表達式模塊 import re # 讀取整個文件內容作為字符串 txt = open('word.txt').read() print(txt) # 對詞頻進行統計,首先需要進行分割把每一個字取出來 # 用非字母的字符作為分割,然后傳給Counter()進行統計 c3 = Counter(re.split('\W+', txt)) # 使用most_common()選取10個頻度最高單詞 print(c3.most_common(10))
以上就是“Python怎么統計序列中元素的出現頻度”這篇文章的所有內容,感謝各位的閱讀!相信大家閱讀完這篇文章都有很大的收獲,小編每天都會為大家更新不同的知識,如果還想學習更多的知識,請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。