91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

web爬蟲中怎么用Selenium操作瀏覽器抓數據

發布時間:2021-12-18 10:48:54 來源:億速云 閱讀:201 作者:小新 欄目:大數據

小編給大家分享一下web爬蟲中怎么用Selenium操作瀏覽器抓數據,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!

Selenium是一個基于Web的開源自動化工具。Python使用Selenium用于自動化測試。 特點是易于使用。Selenium可以將標準Python命令發送到不同的瀏覽器,盡管它們的瀏覽器設計有所不同。

使用Selenium自動打開谷歌瀏覽器然后訪問地址http://econpy.pythonanywhere.com/ex/001.html,并將改頁面中的購買者姓名和商品價格抓取下來打印,然后自動關閉瀏覽器的操作。

分析頁面源代碼可知 購買者姓名和商品價格的html代碼信息如下:

web爬蟲中怎么用Selenium操作瀏覽器抓數據

使用Selenium自動打開谷歌瀏覽器的時候需要下載谷歌的驅動程序,我的谷歌瀏覽器版本為74:

web爬蟲中怎么用Selenium操作瀏覽器抓數據

所以我們訪問驅動程序下載地址:

https://sites.google.com/a/chromium.org/chromedriver/downloads

進行下載:

web爬蟲中怎么用Selenium操作瀏覽器抓數據

然后我們要使用Selenium 需要進行安裝,這里使用pip install selenium。

接下來開始編碼部分:

#導入包from selenium import webdriver#打開谷歌瀏覽器 并訪問要抓取數據的地址#注意:驅動chromedriver.exe與改python文件在同一個目錄driver = webdriver.Chrome('chromedriver.exe') driver.get("http://econpy.pythonanywhere.com/ex/001.html")# 使用xpath找到購買者和商品價格元素列表buyers = driver.find_elements_by_xpath('//div[@title="buyer-name"]')prices = driver.find_elements_by_xpath('//span[@class="item-price"]')
# 打印所有信息num_page_items = len(buyers)for i in range(num_page_items):    print(buyers[i].text + " : " + prices[i].text)
#完成任務后 關閉瀏覽器driver.close()

運行結果部分內容為:

Carson Busses : $29.95Earl E. Byrd : $8.37Patty Cakes : $15.26Derri Anne Connecticut : $19.25Moe Dess : $19.25Leda Doggslife : $13.99Dan Druff : $31.57Al Fresco : $8.49。。。。。。

我簡單錄制了一下運行過程,由于單手操作錄制,畫面抖動,大家對付觀看一下,過程為:運行程序,自動打開谷歌瀏覽器,訪問地址,抓取數據打印,關閉瀏覽器完成

看完了這篇文章,相信你對“web爬蟲中怎么用Selenium操作瀏覽器抓數據”有了一定的了解,如果想了解更多相關知識,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

马鞍山市| 丽江市| 庆城县| 定日县| 白银市| 宁夏| 剑河县| 寿阳县| 昭觉县| 阿拉善左旗| 怀远县| 那坡县| 筠连县| 定兴县| 洪洞县| 黄浦区| 团风县| 道真| 陵川县| 五原县| 龙江县| 卢湾区| 新建县| 婺源县| 博野县| 陇南市| 邹平县| 太和县| 清苑县| 中宁县| 潮安县| 临海市| 灵台县| 黄冈市| 太谷县| 咸阳市| 东丰县| 天台县| 板桥市| 西城区| 醴陵市|