您好,登錄后才能下訂單哦!
Python中怎么自動獲取目標網站最新通知,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。
1.建立通知數據庫
這一步的目的是爬取目標網站已經發布的通知的數據,并進行存儲,從而建立與該目標網站內容相對應的本地數據庫。
考慮到數據庫中的數據將是辨別和獲取一則新通知的唯一方法,因此所建立的數據庫將存儲每一條通知的標題、發布日期和訪問鏈接。
第一步使用到的模塊有urllib、BeautifulSoup和sqlite3模塊。其中,通過urllib模塊爬取目標網頁html數據;通過BeautifulSoup模塊解析網頁數據、爬取網頁內容;通過sqlite3模塊建立目標網站已有通知數據庫。
2.建立郵件發送系統
這一步的目的是使用Python標準庫模塊smtplib來訪問網絡,創建一個發送電子郵件的功能。
由于我們大部分人的計算機并沒有建立自己的郵件服務器,因此需借助第三方服務器來模擬郵件發送。
常用的有谷歌郵件系統、網易郵件系統和QQ郵件系統,如QQ郵件系統的SMTP服務器和端口號分別為smtp.qq.com和465。
該步主要代碼展示如下。
在這個示例中,使用了Python標準庫中的email模塊將電子郵件信息進行了格式化,主要包括郵件的主題與發件人、收件人郵箱昵稱和郵件內容等信息。
前面兩步,已經完成了目標網站已有通知數據庫和郵件發送系統的建立,第三步要完成的工作,主要由兩部分組成。
一是,利用第一步使用的urllib、BeautifulSoup模塊解析目標網站內容數據,并與前面建立的數據庫進行對比檢測。
二是,若檢測到目標網站有新的通知,則將新通知數據插入到數據庫中,然后,發送提示電子郵件。
該步主要代碼展示如下。
在這個示例中,只選取了最新的一條通知發送了電子郵件提示,具體郵件信息可自己設定。
前面三步,已經完成了使用Python獲取目標網站最新通知,并發送提示電子郵件的腳本程序。
在這一步,將使用Windows自帶的DOS命令框架和任務計劃程序去每小時自動運行一次Python腳本,實現自動更新通知的目的。
首先,需要編寫一個cmd命令文件,方便在DOS框架下執行Python腳本。
主要代碼展示如下:
@echo off # 關閉回顯 cd C:\demo # 找到Python腳本文件的路徑 python Python.py # 執行Python腳本文件
最后,使用任務計劃程序制定一個任務,可設定為每隔一小時自動運行一次cmd命令文件。
看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。