您好,登錄后才能下訂單哦!
本篇文章為大家展示了如何利用selenium庫爬取京東python書籍一百頁存入csv,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。
1、分析頁面。
我們以前利用requests庫等獲取獲取很麻煩。
利用selenium庫可以省很多事情,我們只需要獲取點擊到下一頁,
爬取我們需要的商品信息,存入csv。
所以我們要寫三個方法來實現。
2、實現獲取商品信息get_products方法。
我們需要抓取,編號,書名,價格,評價數量,出版社,
我們打開京東頁面,切換到開發者模式,如圖:
所有的商品都有一個類名:gl-item
data-sku為一個編號,后面的class名需要用到。
價格的class是J_加上編號
評價數的id是J_comment_加上編號
書名的class是p-name
出版社的class是curr-shop
于是乎我們可以實現get_products獲取商品的信息:
3、實現點擊下一頁
4、存入csv
上述內容就是如何利用selenium庫爬取京東python書籍一百頁存入csv,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。