91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么使用Python爬取網易云歌曲評論實現詞云圖

發布時間:2022-06-02 16:47:06 來源:億速云 閱讀:197 作者:iii 欄目:開發技術

這篇文章主要講解了“怎么使用Python爬取網易云歌曲評論實現詞云圖”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“怎么使用Python爬取網易云歌曲評論實現詞云圖”吧!

環境使用

Python 3.8 解釋器 3.10

Pycharm 2021.2 專業版

selenium 3.141.0

代碼實現

先是安裝、導入所需模塊

from selenium import webdriver  # 導入瀏覽器的功能
import re   # 正則表達式模塊, 內置
import time   # 時間模塊, 程序延遲

1. 創建一個瀏覽器對象

driver = webdriver.Chrome()

2. 執行自動化

driver.get('https://music.163.com/#/song?id=488249475')
# selenium無法直接獲取到嵌套頁面里面的數據
driver.switch_to.frame(0)  # switch_to.frame()  切換到嵌套網頁
driver.implicitly_wait(10)  # 讓瀏覽器加載的時候, 等待渲染頁面

下拉頁面, 直接下拉到頁面的底部

js = 'document.documentElement.scrollTop = document.documentElement.scrollHeight'
driver.execute_script(js)

3.解析數據

divs = driver.find_elements_by_css_selector('.itm') 
# 所有div  css語法: 定位到 html 數據/xpath/正則
for div in divs:
    cnt = div.find_element_by_css_selector('.cnt.f-brk').text
    cnt = re.findall(':(.*)', cnt)[0]  # 中英文有區別
    print(cnt)

保存數據

翻頁

for page in range(10):  # 控制翻頁  速度太快
    # 翻頁 , 找到下一頁標簽, 點擊?
    driver.find_element_by_css_selector('.znxt').click()
    time.sleep(1)
# selenium  欲速則不達

保存為txt文件

with open('contend.txt', mode='a', encoding='utf-8') as f:
    f.write(cnt + '\n')

運行代碼得到結果

怎么使用Python爬取網易云歌曲評論實現詞云圖

再做個詞云

導入相關模塊

import jieba  # 中文分詞庫  pip install jieba
import wordcloud  # 制作詞云圖的模塊  pip install wordcloud
import imageio

讀取文件數據

with open('contend.txt', mode='r', encoding='utf-8') as f:
    txt = f.read()
print(txt)

詞云圖 分詞<中文(詞語)> 基于結果

txt_list = jieba.lcut(txt)
print('分詞結果:', txt_list)

合并

string_ = ' '.join(txt_list)  # 1 + 1 = 2   字符串的基本語法
print('合并分詞:', string_)

創建詞云圖

wc = wordcloud.WordCloud(
    width=1000,  # 圖片的寬
    height=800,  # 圖片的高
    background_color='white',  # 圖片的背景色
    font_path='msyh.ttc',  # 微軟雅黑
    scale=15,  # 詞云圖默認的字體大小
    # mask=img,  # 指定詞云圖的圖片
    # 停用詞&lt; 語氣詞, 助詞,....
    stopwords=set([line.strip() for line in open('cn_stopwords.txt', mode='r', encoding='utf-8').readlines()] )
)
print('正在繪制詞云圖...')
wc.generate(string_)  # 繪制詞云圖
wc.to_file('out.png')  # 保存詞云圖
print('詞云圖繪制完成...')

最后效果

怎么使用Python爬取網易云歌曲評論實現詞云圖

感謝各位的閱讀,以上就是“怎么使用Python爬取網易云歌曲評論實現詞云圖”的內容了,經過本文的學習后,相信大家對怎么使用Python爬取網易云歌曲評論實現詞云圖這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

阳西县| 夏邑县| 资讯| 长葛市| 筠连县| 古交市| 济宁市| 东明县| 福清市| 岚皋县| 日土县| 章丘市| 江都市| 弥勒县| 武城县| 塘沽区| 平武县| 芦溪县| 明水县| 红河县| 景宁| 竹溪县| 砚山县| 临洮县| 资溪县| 惠州市| 长春市| 大余县| 建湖县| 玛多县| 临沧市| 军事| 巫溪县| 翼城县| 屯门区| 平利县| 兴义市| 新宁县| 永宁县| 廊坊市| 大荔县|