91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何使用Python爬了你們單身的原因

發布時間:2021-10-28 18:21:24 來源:億速云 閱讀:142 作者:柒染 欄目:編程語言

如何使用Python爬了你們單身的原因,相信很多沒有經驗的人對此束手無策,為此本文總結了問題出現的原因和解決方法,通過這篇文章希望你能解決這個問題。

前兩天偶然在微博看到這樣的一個關于520,七夕,情人節等等的普法教育。。。!相信前幾天的七夕很多小仙女都收到了來自對方的愛意!

如何使用Python爬了你們單身的原因

可是還有很多伙伴連發紅包的機會都沒有。。。

如何使用Python爬了你們單身的原因

我就是這類,沒收到愛意,也沒機會送出愛意的這類!我也不知道我為什么還單著!哈哈哈,我想知道,這么多單著的人,你們單著是因為什么!爬蟲!爬蟲!爬蟲!

大家說說,單著的這么多人,有分析過為什么如此優秀的你卻還是單身呢?

一、需求背景

今天逛微博的時候發現一個有趣的話題#90后單身原因TOP3#

七夕之際,一份針對全國90后青年婚戀觀進行抽樣調查公布了結果。結果顯示,一線城市單身占比持續領先。90后單身原因TOP3:圈子小、工作忙、對愛情幻想過于完美。

單身的三大原因:圈子小、工作忙、對愛情幻想過于完美!

我倒覺得這三個原因都似乎并不合理,難道單身的原因難道不是因為窮嗎?哭唧唧。。。

二、功能描述

好奇這個調查是怎么來的?真實性有待考證,剛好這幾天我們也學習了如何爬取微博話題,今天就來分析一下為何很多同學如此優秀卻依然單身!

三、技術方案

  1. 模擬登錄微博

  2. 爬取話題

  3. 保存文件

  4. 數據清洗

  5. 數據分析

四、模擬登錄

模擬登錄之前講爬取#周杰倫超話#的時候已經講過了,這里就不再重復,直接貼出代碼!

如何使用Python爬了你們單身的原因

五、爬取話題

1.找到話題加載數據url

如何使用Python爬了你們單身的原因

https://m.weibo.cn/api/container/getIndex?containerid=100103type%3D61%26q%3D%2390%E5%90%8E%E5%8D%95%E8%BA%AB%E5%8E%9F%E5%9B%A0TOP3%23%26t%3D0&isnewpage=1&extparam=pos%3D41%26c_type%3D31%26realpos%3D40%26flag%3D0%26filter_type%3Drealtimehot%26cate%3D0%26display_time%3D1565179797&luicode=10000011&lfid=106003type%3D25%26t%3D3%26disable_hot%3D1%26filter_type%3Drealtimehot&page_type=searchall

2.代碼模擬請求數據

我們依然使用requests庫來爬取數據,這次豬哥在請求的時候增加了一個參數:timeout,這樣做是為了防止請求某個一直沒有應答導致堵死其他請求!

如何使用Python爬了你們單身的原因

3.提取微博內容

要想提取微博內容就需要了解請求返回的數據格式

如何使用Python爬了你們單身的原因

了解數據格式之后我們就可以寫代碼提取我們想要的微博內容啦!

如何使用Python爬了你們單身的原因

上圖我們已經拿到微博內容,但是還有很多網頁標簽,我們來用正則將網頁標簽去掉,和開頭的話題開頭!

如何使用Python爬了你們單身的原因

4.保存文件

微博內容提取出來之后,我們將他們保存起來!

如何使用Python爬了你們單身的原因

六、批量爬取

批量爬取就涉及分頁,上次我們將周杰倫超話時,它的分頁機制是:

微博超話分頁機制:根據時間分頁,每一條微博都有一個since_id,時間越大的since_id越大所以在請求時將since_id傳入,則會加載對應話題下比此since_id小的微博,然后又重新獲取最小since_id將最小since_id傳入,依次請求,這樣便實現分頁

那這個話題的分頁機制也是這樣的嗎?我們來對比一下第一次請求與第二次請求的url

如何使用Python爬了你們單身的原因

我們發現普通話題的分頁機制竟然是page的形式,看來微博對不同級別的話題有不同的分頁機制!

page形式的分頁機制,之前我們講了很多個案例,直接for循環傳入i,而這個i就當作page就可以啦!

如何使用Python爬了你們單身的原因

七、數據分析

數據分析我們采用pyecharts庫,這是一個非常好用的可視化分析庫!

如何使用Python爬了你們單身的原因

先讀取數據,然后使用jieba庫進行分詞和數據清洗,最后使用pyecharts庫做展示!

如何使用Python爬了你們單身的原因

之前調查結果顯示單身的三大原因是:圈子小、工作忙、對愛情幻想過于完美。在我們數據分析得出的結果好像也確實如此!

看完上述內容,你們掌握如何使用Python爬了你們單身的原因的方法了嗎?如果還想學到更多技能或想了解更多相關內容,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

清流县| 贡嘎县| 廊坊市| 合江县| 河间市| 绥阳县| 开化县| 高雄市| 哈密市| 吉安县| 竹北市| 钟山县| 达拉特旗| 苍梧县| 农安县| 漳平市| 边坝县| 隆林| 灵丘县| 友谊县| 常山县| 登封市| 祁东县| 常德市| 耒阳市| 尤溪县| 呼玛县| 克拉玛依市| 广水市| 东阳市| 富川| 娄底市| 台州市| 昌黎县| 噶尔县| 景德镇市| 盐山县| 老河口市| 霍州市| 胶南市| 普兰县|