Python中怎么爬取電影天堂數據

發布時間：2021-07-10 13:50:40 來源：億速云閱讀：194 作者：Leah 欄目：大數據

這期內容當中小編將會給大家帶來有關Python中怎么爬取電影天堂數據，文章內容豐富且以專業的角度為大家分析和敘述，閱讀完這篇文章希望大家可以有所收獲。

首先打開Pycharm點擊File再點開setting。

Python中怎么爬取電影天堂數據

打開后會出現這個界面點擊你的項目名字（project：（你的項目名字））project interpreter點擊加號下載我們需要的庫本項目需要（requests，requests，time，re模塊），如下圖所示。

Python中怎么爬取電影天堂數據

我們需要（requests，requests，time，re模塊），如下圖所示。

Python中怎么爬取電影天堂數據

這個time是用于防止反爬，設置的時間延時。

首先我們來分析一下這個網址下一頁得到特點。

Python中怎么爬取電影天堂數據

在主方法main函數里邊用for循環實現遍歷網址。

Python中怎么爬取電影天堂數據

說明你已經成功一半了加油！！

現在我們需要對這些網址發生請求，為了更直觀的看出來，我們用一個類寫。

我們用requests發生請求這個網站的編碼是gbk （怎么看網站的編碼?）。

打開一個網站右鍵檢查在header的標簽，以這個網站為例，可以看到charset=“gb312”。

這個gb2312就是編碼我們常見的編碼方式有2種（utf_8, gbk）。

Python中怎么爬取電影天堂數據

我們可以驗證一下是不是真的請求到了。使用Print（html）看到這個結果(一個完整的html網頁)說明請求成功。

Python中怎么爬取電影天堂數據

所以我們可以先找到table，一層一層的去找，可以參考一下下面的圖。

Python中怎么爬取電影天堂數據

點開第二級頁面如圖右鍵點擊下載鏈接，如下圖所示：

Python中怎么爬取電影天堂數據

我們用正則表達式解析得到我們下載鏈接地址，如下圖所示：

Python中怎么爬取電影天堂數據

得到結果，如下圖所示：

Python中怎么爬取電影天堂數據

最后我們優化一下請求的代碼有點重復我們優化一下；

用一個值去保存說明請求頭的內容以后請求我們只有調用這個方法進行請求就好，如下圖所示：

Python中怎么爬取電影天堂數據

上述就是小編為大家分享的Python中怎么爬取電影天堂數據了，如果剛好有類似的疑惑，不妨參照上述分析進行理解。如果想知道更多相關知識，歡迎關注億速云行業資訊頻道。

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本