您好,登錄后才能下訂單哦!
小編給大家分享一下web爬蟲中怎么用Selenium操作瀏覽器抓數據,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!
Selenium是一個基于Web的開源自動化工具。Python使用Selenium用于自動化測試。 特點是易于使用。Selenium可以將標準Python命令發送到不同的瀏覽器,盡管它們的瀏覽器設計有所不同。
使用Selenium自動打開谷歌瀏覽器然后訪問地址http://econpy.pythonanywhere.com/ex/001.html,并將改頁面中的購買者姓名和商品價格抓取下來打印,然后自動關閉瀏覽器的操作。
分析頁面源代碼可知 購買者姓名和商品價格的html代碼信息如下:
使用Selenium自動打開谷歌瀏覽器的時候需要下載谷歌的驅動程序,我的谷歌瀏覽器版本為74:
所以我們訪問驅動程序下載地址:
https://sites.google.com/a/chromium.org/chromedriver/downloads
進行下載:
然后我們要使用Selenium 需要進行安裝,這里使用pip install selenium。
接下來開始編碼部分:
#導入包
from selenium import webdriver
#打開谷歌瀏覽器 并訪問要抓取數據的地址
#注意:驅動chromedriver.exe與改python文件在同一個目錄
driver = webdriver.Chrome('chromedriver.exe')
driver.get("http://econpy.pythonanywhere.com/ex/001.html")
# 使用xpath找到購買者和商品價格元素列表
buyers = driver.find_elements_by_xpath('//div[@title="buyer-name"]')
prices = driver.find_elements_by_xpath('//span[@class="item-price"]')
# 打印所有信息
num_page_items = len(buyers)
for i in range(num_page_items):
print(buyers[i].text + " : " + prices[i].text)
#完成任務后 關閉瀏覽器
driver.close()
運行結果部分內容為:
Carson Busses : $29.95Earl E. Byrd : $8.37Patty Cakes : $15.26Derri Anne Connecticut : $19.25Moe Dess : $19.25Leda Doggslife : $13.99Dan Druff : $31.57Al Fresco : $8.49。。。。。。
我簡單錄制了一下運行過程,由于單手操作錄制,畫面抖動,大家對付觀看一下,過程為:運行程序,自動打開谷歌瀏覽器,訪問地址,抓取數據打印,關閉瀏覽器完成
看完了這篇文章,相信你對“web爬蟲中怎么用Selenium操作瀏覽器抓數據”有了一定的了解,如果想了解更多相關知識,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。