Python爬蟲后如何獲取重定向url

發布時間：2021-04-29 09:57:32 來源：億速云閱讀：2176 作者：小新欄目：編程語言

小編給大家分享一下Python爬蟲后如何獲取重定向url，相信大部分人都還不怎么了解，因此分享這篇文章給大家參考一下，希望大家閱讀完這篇文章后大有收獲，下面讓我們一起去了解一下吧！

python的數據類型有哪些?

python的數據類型：1. 數字類型，包括int（整型）、long（長整型）和float（浮點型）。2.字符串，分別是str類型和unicode類型。3.布爾型，Python布爾類型也是用于邏輯運算，有兩個值：True（真）和False（假）。4.列表，列表是Python中使用最頻繁的數據類型，集合中可以放任何數據類型。5. 元組，元組用”()”標識，內部元素用逗號隔開。6. 字典，字典是一種鍵值對的集合。7. 集合，集合是一個無序的、不重復的數據組合。

我們在使用python寫爬蟲在爬取頁面時會遇到網頁被重定向的情況，當點點擊一個網頁跳轉到另一個頁面，URL的地址都會改變，會導致無法請求到數據。Python爬蟲后獲取重定向url的兩種方法：1、導入urllib庫獲得重定向url；2、設置瀏覽器代理，請求網頁。

方法一：導入urllib庫獲得重定向url

# 獲得重定向url
from urllib import request
# https://zhidao.baidu.com/question/681501874175782812.html
url = "https://www.baidu.com/link?url=IscBx0u8h9q4Uq3ihTs_PqnoNWe7slVWAd2dowQKrnqJedvthb3zrh9 
JqcMJu3ZqFrbW_DKVuTnTypDbMkZx_hwCQIGFPRVWGyxRXA-65jK&wd=&eqid=f7aeecba00092ed7000000065ec62596"
print(request.urlopen(url).geturl())

方法二：設置瀏覽器代理，請求網頁。

# 請求頭，這里我設置了瀏覽器代理
headers = headers = {'User-Agent': 'xx'}
# 這里chrome的user-agent獲取方式：在瀏覽器地址欄輸入 about://version 即可得到結果
url = "https://www.baidu.com/link?url=IscBx0u8h9q4Uq3ihTs_PqnoNWe7slVWAd2dowQKrnqJedvthb3 
zrh9JqcMJu3ZqFrbW_DKVuTnTypDbMkZx_hwCQIGFPRVWGyxRXA-65jK&wd=&eqid=f7aeecba00092ed7000000065ec62596"
# 請求網頁
response = requests.get(url, headers=headers)
# print(response.status_code) # 打印響應的狀態碼
print(response.url) # 打印重定向后的網址

以上是“Python爬蟲后如何獲取重定向url”這篇文章的所有內容，感謝各位的閱讀！相信大家都有了一定的了解，希望分享的內容對大家有所幫助，如果還想學習更多知識，歡迎關注億速云行業資訊頻道！

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

Python爬蟲后如何獲取重定向url

python的數據類型有哪些?

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

Python爬蟲后如何獲取重定向url

python的數據類型有哪些?

猜你喜歡

最新資訊

相關推薦

相關標簽