您好,登錄后才能下訂單哦!
這篇文章主要介紹python分布式爬蟲中的scrapy-redis是不是屬于新框架,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!
安裝:
pip install scrapy-redis
scrapy_redis在scrapy的基礎上實現了更多,更強大的功能,具體體現在:
請求對象的持久化
去重的持久化
實現分布式
scrapy-redis只是替換了redis的幾個組件,不是一個新的框架。
scrapy_redis的流程
在scrapy_redis中,所有的帶抓取的對象和去重的指紋都存在所有的服務器公用的redis中
所有的服務器共用一個redis中的request對象
所有的request對象存入redis前,都會在同一個redis中進行判斷,之前是否已經存入過
在默認情況下所有的數據會保存在redis中
以上是“python分布式爬蟲中的scrapy-redis是不是屬于新框架”這篇文章的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。