91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么用Python分析紅樓夢關鍵詞

發布時間:2021-12-27 13:37:24 來源:億速云 閱讀:389 作者:iii 欄目:大數據

這篇文章主要介紹“怎么用Python分析紅樓夢關鍵詞”,在日常操作中,相信很多人在怎么用Python分析紅樓夢關鍵詞問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”怎么用Python分析紅樓夢關鍵詞”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!

Python工具包準備

想要完成一個文本的分詞,我們需要分詞工具;而要將分詞統計結果用詞云圖畫出來,我們需要一個詞云工具:


0       1      
分詞工具jieba      


jieba 是基于Python的中文分詞工具,安裝使用非常方便。


我們使用pip安裝:


怎么用Python分析紅樓夢關鍵詞


02
詞云工具wordcloud


wordcloud庫,可以說是python非常優秀的詞云展示第三方庫。詞云以詞語為基本單位更加直觀和藝術的展示文本詞云圖,也叫文字云,是對文本中出現頻率較高的“關鍵詞”予以視覺化的展現,詞云圖過濾掉大量的低頻低質的文本信息,使得瀏覽者只要一眼掃過文本就可領略文本的主旨。


效果舉例:


怎么用Python分析紅樓夢關鍵詞


我們使用pip安裝:


怎么用Python分析紅樓夢關鍵詞


文本和圖片準備


0 1      
紅樓夢.txt


為了讓分詞工具進行分析,我們下載紅樓夢小說txt格式。為了方便,我們將紅樓夢文檔放在程序“fenci.py”所在目錄“分詞”下的txt文件夾里面:


怎么用Python分析紅樓夢關鍵詞



0 2      
背景.jpg


像上面的詞云圖的形狀是一個鯨魚,我們需要準備一個有圖案的背景圖,讓最后的詞云圖貼合背景圖案。


我們選用這張寶玉的美男子畫像圖作為背景圖:


怎么用Python分析紅樓夢關鍵詞

文件保存在程序當前文件夾的img目錄下:


怎么用Python分析紅樓夢關鍵詞



0 3      
停用詞.txt


在信息檢索中,為節省存儲空間和提高搜索效率,在處理自然語言數據(或文本)之前或之后會自動過濾掉某些字或詞,這些字或詞即被稱為StopWords(停用詞)。


但是,由于紅樓夢有很多特殊的用詞,比如“這會子”,"明兒"等等,大家可以選擇自行添加一些停用詞。比如我加了一些詞:


怎么用Python分析紅樓夢關鍵詞


我們把停用詞放在words文件夾下面:


怎么用Python分析紅樓夢關鍵詞



程序運行

我們將最大次數設置成500個,為了能讓背景圖案比較明顯:


怎么用Python分析紅樓夢關鍵詞

從結果看來,寶玉是當之無愧的主角。鳳姐,賈母,王夫人等人戲份也不少。由于黛玉和林黛玉被分成了兩個詞,因此顯得戲份很少,大家想想有沒有辦法解決這個問題?另外,我們可以看到“這會子”這個詞出現頻率也不低,從中可以一窺當時的方言的感覺。

到此,關于“怎么用Python分析紅樓夢關鍵詞”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

杨浦区| 厦门市| 孙吴县| 景谷| 昌都县| 土默特左旗| 抚松县| 鹰潭市| 新建县| 泉州市| 双鸭山市| 锦州市| 唐海县| 罗山县| 满城县| 津市市| 西和县| 台州市| 田林县| 江城| 喀喇沁旗| 卢氏县| 晴隆县| 镇坪县| 安多县| 尼玛县| 鲁山县| 孝感市| 通山县| 东台市| 梨树县| 贡山| 中江县| 平和县| 额尔古纳市| 永顺县| 镇赉县| 高雄县| 湘潭市| 绥宁县| 洱源县|