您好,登錄后才能下訂單哦!
這篇文章主要介紹了python怎樣生成詞云,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
很多同學對詞云很感興趣,就是給一段文本,然后根據它的詞頻,生成出好看的詞云,就像下面這張圖一樣:
生成這個其實很簡單,python代碼我已經放在github上面了,大家下載下來就能直接用:
https://github.com/godweiyang/wordcloud
下面我講講怎么使用這個代碼。
首先需要python3環境,推薦使用Anaconda安裝。
然后需要 jieba
和 wordcloud
庫,所以運行下面兩條命令安裝兩個庫: pip3 install jieba
pip3 install wordcloud
這個代碼文件夾是如下結構:
data
templates 這個文件夾下放所有你詞云想要的樣式圖片,背景色最好簡單一點。
stopwords.txt
這是停止詞文件,對于你不想在詞云中出現的詞,你都可以添加到這個文件中過濾掉它。
fonts 這個文件夾下放詞云中顯示的字體。
create_word_cloud.py
這是詞云的主代碼。
preprocess.py
這是用來預處理QQ聊天記錄的。
對于一般的文本文件,直接運行 python3 create_word_cloud.py filename.txt
就能生成詞云了,效果如下:
首先打開消息記錄,點擊下方的消息管理器:
然后在需要導出的聊天對象上面右鍵點擊導出消息記錄:
然后保存類型選擇 txt
,點保存,并將文件保存在 wordcloud
根目錄下:
然后打開命令行運行 python3 preprocess.py filename.txt
,用來去掉聊天記錄中的昵稱和時間等信息:
最后運行 python3 create_word_cloud.py __filename.txt
就能生成詞云了。
感謝你能夠認真閱讀完這篇文章,希望小編分享的“python怎樣生成詞云”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。