怎么使用Python爬取網易云歌曲評論實現詞云圖

發布時間：2022-06-02 16:47:06 來源：億速云閱讀：197 作者：iii 欄目：開發技術

這篇文章主要講解了“怎么使用Python爬取網易云歌曲評論實現詞云圖”，文中的講解內容簡單清晰，易于學習與理解，下面請大家跟著小編的思路慢慢深入，一起來研究和學習“怎么使用Python爬取網易云歌曲評論實現詞云圖”吧！

環境使用

Python 3.8 解釋器 3.10

Pycharm 2021.2 專業版

selenium 3.141.0

代碼實現

先是安裝、導入所需模塊

from selenium import webdriver  # 導入瀏覽器的功能
import re   # 正則表達式模塊, 內置
import time   # 時間模塊, 程序延遲

1. 創建一個瀏覽器對象

driver = webdriver.Chrome()

2. 執行自動化

driver.get('https://music.163.com/#/song?id=488249475')
# selenium無法直接獲取到嵌套頁面里面的數據
driver.switch_to.frame(0)  # switch_to.frame()  切換到嵌套網頁
driver.implicitly_wait(10)  # 讓瀏覽器加載的時候, 等待渲染頁面

下拉頁面, 直接下拉到頁面的底部

js = 'document.documentElement.scrollTop = document.documentElement.scrollHeight'
driver.execute_script(js)

3.解析數據

divs = driver.find_elements_by_css_selector('.itm') 
# 所有div  css語法: 定位到 html 數據/xpath/正則
for div in divs:
    cnt = div.find_element_by_css_selector('.cnt.f-brk').text
    cnt = re.findall('：(.*)', cnt)[0]  # 中英文有區別
    print(cnt)

保存數據

翻頁

for page in range(10):  # 控制翻頁  速度太快
    # 翻頁 , 找到下一頁標簽, 點擊?
    driver.find_element_by_css_selector('.znxt').click()
    time.sleep(1)
# selenium  欲速則不達

保存為txt文件

with open('contend.txt', mode='a', encoding='utf-8') as f:
    f.write(cnt + '\n')

運行代碼得到結果

怎么使用Python爬取網易云歌曲評論實現詞云圖

再做個詞云

導入相關模塊

import jieba  # 中文分詞庫  pip install jieba
import wordcloud  # 制作詞云圖的模塊  pip install wordcloud
import imageio

讀取文件數據

with open('contend.txt', mode='r', encoding='utf-8') as f:
    txt = f.read()
print(txt)

詞云圖分詞<中文(詞語)> 基于結果

txt_list = jieba.lcut(txt)
print('分詞結果:', txt_list)

合并

string_ = ' '.join(txt_list)  # 1 + 1 = 2   字符串的基本語法
print('合并分詞:', string_)

創建詞云圖

wc = wordcloud.WordCloud(
    width=1000,  # 圖片的寬
    height=800,  # 圖片的高
    background_color='white',  # 圖片的背景色
    font_path='msyh.ttc',  # 微軟雅黑
    scale=15,  # 詞云圖默認的字體大小
    # mask=img,  # 指定詞云圖的圖片
    # 停用詞&lt; 語氣詞, 助詞,....
    stopwords=set([line.strip() for line in open('cn_stopwords.txt', mode='r', encoding='utf-8').readlines()] )
)
print('正在繪制詞云圖...')
wc.generate(string_)  # 繪制詞云圖
wc.to_file('out.png')  # 保存詞云圖
print('詞云圖繪制完成...')

最后效果

怎么使用Python爬取網易云歌曲評論實現詞云圖

感謝各位的閱讀，以上就是“怎么使用Python爬取網易云歌曲評論實現詞云圖”的內容了，經過本文的學習后，相信大家對怎么使用Python爬取網易云歌曲評論實現詞云圖這一問題有了更深刻的體會，具體使用情況還需要大家實踐驗證。這里是億速云，小編將為大家推送更多相關知識點的文章，歡迎關注！

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

怎么使用Python爬取網易云歌曲評論實現詞云圖

環境使用

代碼實現

先是安裝、導入所需模塊

1. 創建一個瀏覽器對象

2. 執行自動化

下拉頁面, 直接下拉到頁面的底部

3.解析數據

保存數據

翻頁

保存為txt文件

運行代碼得到結果

再做個詞云

導入相關模塊

讀取文件數據

詞云圖分詞<中文(詞語)> 基于結果

合并

創建詞云圖

最后效果

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

怎么使用Python爬取網易云歌曲評論實現詞云圖

環境使用

代碼實現

先是安裝、導入所需模塊

1. 創建一個瀏覽器對象

2. 執行自動化

下拉頁面, 直接下拉到頁面的底部

3.解析數據

保存數據

翻頁

保存為txt文件

運行代碼得到結果

再做個詞云

導入相關模塊

讀取文件數據

詞云圖 分詞<中文(詞語)> 基于結果

合并

創建詞云圖

最后效果

猜你喜歡

最新資訊

相關推薦

相關標簽

詞云圖分詞<中文(詞語)> 基于結果