使用Python怎么爬取豆瓣電影名

發布時間：2021-05-09 12:14:15 來源：億速云閱讀：665 作者：Leah 欄目：編程語言

這期內容當中小編將會給大家帶來有關使用Python怎么爬取豆瓣電影名，文章內容豐富且以專業的角度為大家分析和敘述，閱讀完這篇文章希望大家可以有所收獲。

Python的優點有哪些

1、簡單易用，與C/C++、Java、C# 等傳統語言相比，Python對代碼格式的要求沒有那么嚴格；2、Python屬于開源的，所有人都可以看到源代碼，并且可以被移植在許多平臺上使用；3、Python面向對象，能夠支持面向過程編程,也支持面向對象編程；4、Python是一種解釋性語言，Python寫的程序不需要編譯成二進制代碼，可以直接從源代碼運行程序；5、Python功能強大，擁有的模塊眾多，基本能夠實現所有的常見功能。

一、爬蟲豆瓣電影名思路分析

1、爬蟲代理

 headers = {
        'user-agent':
            'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit' +
            '/537.36 (KHTML, like Gecko) Chrome/57.0.2987.98 Safari/537.36'
    }

2、獲取網絡連接

 res = requests.get("https://movie.douban.com/top250", headers=headers)

第一個參數就是網址，要確保網址能夠打開，第二個參數就是代理。

3、對網址進行解析

soup = BeautifulSoup(res.text, 'lxml')

第一個參數是網站，后綴名".text"是將網站源碼轉換為文本，方便解析；

第二個參數是解析器，而lxml就是一種解析器，用來解析網站。

4、匹配所有電影名所在的標簽

 targets = soup.find_all("div", class_="hd")

5、使用簡單的for循環，輸出標簽中的電影名

   for each in targets:
       print(each.a.span.text)

循環輸出就可以了，但要注意轉換為文本，避免出現亂碼的情況。

二、爬蟲豆瓣電影名簡單代碼示例

import requests
from bs4 import BeautifulSoup

if __name__ == '__main__':
    headers = {
        'user-agent':
            'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit' +
            '/537.36 (KHTML, like Gecko) Chrome/57.0.2987.98 Safari/537.36'
    }
    res = requests.get("https://movie.douban.com/top250", headers=headers)
    print(res.status_code)
    soup = BeautifulSoup(res.text, 'lxml')
    targets = soup.find_all("div", class_="hd")
    for each in targets:
        print(each.a.span.text

上述就是小編為大家分享的使用Python怎么爬取豆瓣電影名了，如果剛好有類似的疑惑，不妨參照上述分析進行理解。如果想知道更多相關知識，歡迎關注億速云行業資訊頻道。

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

使用Python怎么爬取豆瓣電影名

Python的優點有哪些

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

使用Python怎么爬取豆瓣電影名

Python的優點有哪些

猜你喜歡

最新資訊

相關推薦

相關標簽