91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python3爬蟲中Ajax是如何分析方法的

發布時間:2020-08-05 14:18:25 來源:億速云 閱讀:154 作者:小新 欄目:編程語言

這篇文章給大家分享的是有關Python3爬蟲中Ajax是如何分析方法的的內容。小編覺得挺實用的,因此分享給大家做個參考。一起跟隨小編過來看看吧。

這里還以前面的微博為例,我們知道拖動刷新的內容由Ajax加載,而且頁面的URL沒有變化,那么應該到哪里去查看這些Ajax請求呢?

1. 查看請求

這里還需要借助瀏覽器的開發者工具,下面以Chrome瀏覽器為例來介紹。

首先,用Chrome瀏覽器打開微博的鏈接https://m.weibo.cn/u/2830678474,隨后在頁面中點擊鼠標右鍵,從彈出的快捷菜單中選擇“檢查”選項,此時便會彈出開發者工具,如圖6-2所示:

Python3爬蟲中Ajax是如何分析方法的

                                                                           圖6-2 開發者工具

此時在Elements選項卡中便會觀察到網頁的源代碼,右側便是節點的樣式。

不過這不是我們想要尋找的內容。切換到Network選項卡,隨后重新刷新頁面,可以發現這里出現了非常多的條目,如圖6-3所示。

Python3爬蟲中Ajax是如何分析方法的

                                                                    圖6-3 Network面板結果

前面也提到過,這里其實就是在頁面加載過程中瀏覽器與服務器之間發送請求和接收響應的所有記錄。

Ajax其實有其特殊的請求類型,它叫作xhr。在圖6-3中,我們可以發現一個名稱以getIndex開頭的請求,其Type為xhr,這就是一個Ajax請求。用鼠標點擊這個請求,可以查看這個請求的詳細信息,如圖6-4所示。

Python3爬蟲中Ajax是如何分析方法的

                                                                                 圖6-4 詳細信息

在右側可以觀察到其Request Headers、URL和Response Headers等信息。其中Request Headers中有一個信息為X-Requested-With:XMLHttpRequest,這就標記了此請求是Ajax請求,如圖6-5所示。

Python3爬蟲中Ajax是如何分析方法的

                                                                                  圖6-5 詳細信息

隨后點擊一下Preview,即可看到響應的內容,它是JSON格式的。這里Chrome為我們自動做了解析,點擊箭頭即可展開和收起相應內容,如圖6-6所示。

Python3爬蟲中Ajax是如何分析方法的

                                                                               圖6-6 JSON結果

觀察可以發現,這里的返回結果是我的個人信息,如昵稱、簡介、頭像等,這也是用來渲染個人主頁所使用的數據。JavaScript接收到這些數據之后,再執行相應的渲染方法,整個頁面就渲染出來了。

另外,也可以切換到Response選項卡,從中觀察到真實的返回數據,如圖6-7所示。

Python3爬蟲中Ajax是如何分析方法的

                                                                            圖6-7 Response內容

接下來,切回到第一個請求,觀察一下它的Response是什么,如圖6-8所示。

Python3爬蟲中Ajax是如何分析方法的

                                                                             圖6-8 Response內容

這是最原始的鏈接https://m.weibo.cn/u/2830678474返回的結果,其代碼只有不到50行,結構也非常簡單,只是執行了一些JavaScript。

所以說,我們看到的微博頁面的真實數據并不是最原始的頁面返回的,而是后來執行JavaScript后再次向后臺發送了Ajax請求,瀏覽器拿到數據后再進一步渲染出來的。

2. 過濾請求

接下來,再利用Chrome開發者工具的篩選功能篩選出所有的Ajax請求。在請求的上方有一層篩選欄,直接點擊XHR,此時在下方顯示的所有請求便都是Ajax請求了,如圖6-9所示。

Python3爬蟲中Ajax是如何分析方法的

                                                                                圖6-9 Ajax請求

接下來,不斷滑動頁面,可以看到頁面底部有一條條新的微博被刷出,而開發者工具下方也一個個地出現Ajax請求,這樣我們就可以捕獲到所有的Ajax請求了。

隨意點開一個條目,都可以清楚地看到其Request URL、Request Headers、Response Headers、Response Body等內容,此時想要模擬請求和提取就非常簡單了。

圖6-10所示的內容便是我的某一頁微博的列表信息。

Python3爬蟲中Ajax是如何分析方法的

                                                                                  圖6-10 微博列表信息

感謝各位的閱讀!關于Python3爬蟲中Ajax是如何分析方法的就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

通化市| 珠海市| 万安县| 宿松县| 乃东县| 龙井市| 佛坪县| 西吉县| 峨边| 柞水县| 迁西县| 清涧县| 乌兰浩特市| 柳州市| 博湖县| 文安县| 仙桃市| 江门市| 普定县| 海丰县| 马尔康县| 华蓥市| 安化县| 鲁山县| 嘉兴市| 夏邑县| 靖安县| 陵川县| 额敏县| 崇左市| 乐平市| 肃宁县| 花莲县| 南部县| 平陆县| 楚雄市| 周口市| 伊宁县| 灌阳县| 宜阳县| 朔州市|