您好,登錄后才能下訂單哦!
本篇內容主要講解“怎么用python爬取一組小姐姐圖片”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“怎么用python爬取一組小姐姐圖片”吧!
引入庫
import time import requests from lxml import etree
這三個庫是為了讓我們在請求別人網站的時候,讓程序休息一會,避免別人的網站會攔截或者崩潰和將得到的頁面源代碼進行解析。
利用瀏覽器的開發者模式,對頁面進行分析,找出我們所需要的每個圖片封面url
href = tree.xpath('//*[@id="features"]/div/div[1]/div/div[1]/a/@href')
我們得到了封面的url后,但這還不是我們所需要的,我們所需要的是超鏈接里面的圖片
我們進入后,發現每張圖片都在<p></p>里面,如何我們利用循環得到每張圖片的url地址
for url_img in href: img_url = requests.get(url_img,headers=head) # print(img_url.text) time.sleep(1) t = etree.HTML(img_url.text) url_list = t.xpath("/html/body/section/div/div/div[1]/div[2]/p[2]/img/@src")
剩下的就很簡單了,我們只需對文件進行保存就得到我們想要的結果了。
with open(f"./img/{name}",mode="wb") as f: f.write(download_img.content) print("正在下載:" +name) time.sleep(1)
import time import requests from lxml import etree def get_page_url(): for i in range(1, 4): # 循環3頁 url = f"https://mm.tvv.tw/category/xinggan/{i}/" # 請求頁面得到源代碼 res = requests.get(url,headers=head) # 對源代碼進行解析 tree = etree.HTML(res.text) # 得到每個圖片的封面url(href) href = tree.xpath('//*[@id="features"]/div/div[1]/div/div[1]/a/@href') # print("-------------------------------------------------------") time.sleep(3) for url_img in href: img_url = requests.get(url_img,headers=head) # print(img_url.text) time.sleep(1) t = etree.HTML(img_url.text) url_list = t.xpath("/html/body/section/div/div/div[1]/div[2]/p[2]/img/@src") # print(url_list) time.sleep(1) for url_src in url_list: get_img(url_src) def get_img(url): name = url.rsplit("/",1)[1] time.sleep(2) download_img = requests.get(url,headers=head) with open(f"./img/{name}",mode="wb") as f: f.write(download_img.content) print("正在下載:" +name) time.sleep(1) f.close() if __name__ == '__main__': head = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36"} get_page_url()
到此,相信大家對“怎么用python爬取一組小姐姐圖片”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。