91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

RabbitMQ怎么在python分布式爬蟲中構建

發布時間:2020-11-30 10:11:17 來源:億速云 閱讀:192 作者:小新 欄目:編程語言

這篇文章主要介紹RabbitMQ怎么在python分布式爬蟲中構建,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!

RabbitMQ是比較靠譜的消息中間件,得益于它的確認機制,當一條消息消費后如果設置確定模式,那么確認后才會繼續消費,如果不確定認,那么這個任務將分配給其他消費者。

基于這種確認機制,可以在高可靠性和高數據要求情景中,避免數據抓取的遺漏和丟失。

其設計思路應該是基于mq設計兩個接口,一個用于URL的存放,一個用戶URL的獲取,同時基于Redis的URL去重,通過類似scrapy-redis 的調度使爬蟲運行。

主程序示例:

import pika
 
 
class RabbitMQBASE:
 
    def __new__(cls, *args, **kw):
        if not hasattr(cls, '_instance'):
            org = super(RabbitMQBASE, cls)
            cls._instance = org.__new__(cls)
        return cls._instance
 
    def __init__(self, use='root', pwd='111'):
        user_pwd = pika.PlainCredentials(use, pwd)
        self.s_conn = pika.BlockingConnection(
            pika.ConnectionParameters(host='1.1.1.1', heartbeat_interval=3600, credentials=user_pwd))
 
    def channel(self):
        return self.s_conn.channel()
 
    def close(self):
        """關閉連接"""
        self.s_conn.close()
 
    @staticmethod
    def callback(ch, method, properties, body):
        print(" [消費者] %r" % body)
 
 
class RabbitMQ(RabbitMQBASE):
    """
    type_:交換機類型fanout、direct、topic
    exchange:交換機名字
    queue_name:隊列名字,為空則隨機命名
    exclusive:隊列是否持久化False持久,True不持久
    key_list:消費者的交換機、隊列綁定的關鍵詞列表
    key:生產者路由的關鍵詞
    no_ack:是否確認消息True不確定,False確定
    """
    def __init__(self, use='root', pwd='Kw7pGR4xDD1CsP*U', type_='direct', exchange='test',
                 queue_name=None, exclusive=True, key_list=['test'], key='test', no_ack=True):
        RabbitMQBASE.__init__(self, use=use, pwd=pwd)
        self.type_ = type_
        self.exchange = exchange
        self.queue_name = queue_name
        self.exclusive = exclusive
        self.key = key
        self.key_list = key_list
        self.no_ack = no_ack
 
    def rabbit_get(self):
        """消費者"""
        channel = self.channel()
        channel.exchange_declare(exchange=self.exchange, exchange_type=self.type_)
        if self.queue_name == None:
            result = channel.queue_declare(exclusive=self.exclusive)
            self.queue_name = result.method.queue
        if self.type_ != 'fanout':
            for key in self.key_list:
                channel.queue_bind(exchange=self.exchange,  # 將交換機、隊列、關鍵字綁定
                                   queue=self.queue_name, routing_key=key)
        channel.basic_consume(RabbitMQBASE.callback, queue=self.queue_name, no_ack=self.no_ack)
        channel.start_consuming()
 
    def rabbit_put(self, message='hello word'):
        """生產者"""
        channel = self.channel()
        channel.exchange_declare(exchange=self.exchange, exchange_type=self.type_)
        if self.type_ == 'fanout':
            self.key = ""
        channel.basic_publish(exchange=self.exchange, routing_key=self.key, body=message)
        channel.close()

以上是“RabbitMQ怎么在python分布式爬蟲中構建”這篇文章的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注億速云行業資訊頻道!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

衡阳县| 聂荣县| 上杭县| 江陵县| 扶风县| 边坝县| 青州市| 娄烦县| 武鸣县| 长宁区| 德江县| 昌邑市| 常熟市| 金昌市| 蛟河市| 双牌县| 神木县| 昌乐县| 米易县| 汾西县| 东乌珠穆沁旗| 湛江市| 博罗县| 佛山市| 弋阳县| 奉新县| 福州市| 河津市| 阿城市| 通道| 石棉县| 普兰店市| 麻栗坡县| 贺州市| 柳林县| 横山县| 瑞金市| 辉南县| 肇庆市| 芮城县| 海阳市|