您好,登錄后才能下訂單哦!
小編這次要給大家分享的是如何用Python詞云分析政府工作報告關鍵詞,文章內容豐富,感興趣的小伙伴可以來了解一下,希望大家閱讀完這篇文章之后能夠有所收獲。
前言
十三屆全國人大三次會議作了政府工作報告。這份政府工作報告僅有10500字左右,據悉是改革開放40年以來最短的一次。受到疫情影響,今年的兩會會議適當縮短,政府工作報告也大幅壓縮,體現了“實干為要”的理念。那么,這份政府工作報告突出強調了哪些關鍵詞呢?我們其實可以基于Python技術進行詞頻分析和詞云制作!
import matplotlib.pyplot as plt#繪圖庫 import jieba from wordcloud import WordCloud # 讀入文本數據 fp = open(r'D:\爬蟲下載\2020年政府工作報告.txt','r',encoding='utf-8') content = fp.read() # print(content) #分詞 words = jieba.lcut(content) # 詞頻分析操作 data = {} for word in words: if len(word)>1: if word in data: data[word]+=1 else: data[word]=1 # print(data) #排序 hist = list(data.items())#轉成列表 hist.sort(key=lambda x:x[1],reverse=True) # print(hist) #調試輸出 for i in range(20): # print(hist[i]) print('{:<10}{:>5}'.format(hist[i][0],hist[i][1]))#左對齊10,右對齊5個長度
下表統計了今年的政府工作報告中出現次數最多的幾個關鍵詞。我們可以看到,今年的政府工作報告中提到“發展”的次數最多,一共出現了69次,“發展”一直都是政府工作報告中的重要關鍵詞;其次是“就業”,出現了39次,足以顯示新冠疫情之下就業問題的嚴峻性,以及黨中央、國務院對就業問題的高度重視,政府工作報告中沒有提出全年經濟增速的具體目標,但仍然提出了就業目標——城鎮新增就業900萬人以上、城鎮調查失業率6%左右、城鎮登記失業率5.5%左右;第三多的就是“疫情”,報告中多次提到疫情防控工作,并指出這次新冠肺炎疫情,是新中國成立以來我國遭遇的傳播速度最快、感染范圍最廣、防控難度最大的公共衛生事件。
“企業”作為市場經濟的主體,出現的次數達到了30次,要想保障就業和民生,必須穩住上億市場主體,盡力幫助企業特別是中小微企業、個體工商戶渡過難關,報告提出要加大宏觀政策實施力度,著力穩企業保就業。還有“支持”、“保障”、“加強”、“推進”等鼓舞人心的關鍵詞出現次數也很多,相信大家看到政府工作報告中滿滿的政策“干貨”,信心和底氣也會更足了。
根據關鍵詞的出現次數,我們可以使用Python繪制出政府工作報告詞云圖。Python的詞云功能相當強大,你可以自己設定形狀、字體、大小!
result = ' '.join(words) # print(result) #生成詞云 wc = WordCloud( font_path=r'D:\PPT\ppt字體\思源宋體SC-Regular.otf', background_color = 'white',#背景顏色 width=500,#圖片的寬 height=300, max_font_size=50, min_font_size=12 ) wc.generate(result) wc.to_file(r'.\wordcloud.png')#保存圖片 #顯示圖片 plt.figure('政府工作報告') plt.imshow(wc) plt.axis('off')#關閉坐標軸 plt.show()
看完這篇關于如何用Python詞云分析政府工作報告關鍵詞的文章,如果覺得文章內容寫得不錯的話,可以把它分享出去給更多人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。