91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

使用Python怎么爬取微博熱搜關鍵詞

發布時間:2021-05-09 08:01:00 來源:億速云 閱讀:538 作者:Leah 欄目:編程語言

今天就跟大家聊聊有關使用Python怎么爬取微博熱搜關鍵詞,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。

python是什么意思

Python是一種跨平臺的、具有解釋性、編譯性、互動性和面向對象的腳本語言,其最初的設計是用于編寫自動化腳本,隨著版本的不斷更新和新功能的添加,常用于用于開發獨立的項目和大型項目。

一、爬取微博熱搜關鍵詞需要的第三方庫

1、requests

2、BeautifulSoup 美味湯

3、worldcloud 詞云

4、jieba 中文分詞

5、matplotlib 繪圖

二、爬取微博熱搜關鍵詞代碼示例

import requests
import wordcloud
import jieba
from bs4 import BeautifulSoup
from matplotlib import pyplot as plt
from pylab import mpl

#設置字體
mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['axes.unicode_minus'] = False

url = 'https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&wvr=6'

try:
    #獲取數據
    r = requests.get(url)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    soup = BeautifulSoup(r.text,'html.parser')
    data = soup.find_all('a')
    d_list = []
    for item in data:
        d_list.append(item.text)
    words = d_list[4:-11:]
    #中文分詞
    result = list(jieba.cut(words[0]))
    for word in words[1::]:
        result.extend(jieba.cut(word))
    redata = []
    for it in result:
        if len(it) <= 1:
            continue
        else:
            redata.append(it)
    result_str = ' '.join(redata)
    #輸出詞云圖
    font = r'C:\Windows\Fonts\simhei.ttf'
    w = wordcloud.WordCloud(font_path=font,width=600,height=400)
    w.generate(result_str)
    w.to_file('微博熱搜關鍵詞詞云.png')
    key = list(set(redata))
    x,y = [],[]
    #篩選數據
    for st in key:
        count = redata.count(st)
        if count <= 1:
            continue
        else:
            x.append(st)
            y.append(count)
    x.sort()
    y.sort()
    #繪制結果圖
    plt.plot(x,y)
    plt.show()
except Exception as e:
    print(e)

看完上述內容,你們對使用Python怎么爬取微博熱搜關鍵詞有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注億速云行業資訊頻道,感謝大家的支持。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

新宾| 乌拉特前旗| 鲁甸县| 万宁市| 宣汉县| 龙南县| 凌海市| 邵阳县| 台湾省| 商城县| 拉萨市| 安平县| 临海市| 兰考县| 夹江县| 措美县| 阿勒泰市| 大宁县| 固镇县| 新乡市| 大田县| 高雄市| 尚义县| 贞丰县| 泸水县| 吴川市| 项城市| 琼中| 汉寿县| 闽侯县| 米林县| 长葛市| 塔城市| 周口市| 奎屯市| 安溪县| 祁连县| 金山区| 丰顺县| 西安市| 微博|