您好,登錄后才能下訂單哦!
如果直接從生成驗證碼的頁面把驗證碼下載到本地后識別,再構造表單數據發送的話,會有一個驗證碼同步的問題,即請求了兩次驗證碼,而識別出來的驗證碼并不是實際需要發送的驗證碼。有如下幾種方法解決。
法1:
用session:
mysession = requests.Session() login_url = 'http://xxx.com' checkcode_url='http://yyy.com' html = mysession.get(login_url,timeout=60*4) #....balabala解析操作.... checkcode = mysession.get(checkcode_url,timeout=60*4) with open('checkcode.png','wb') as f: f.write(checkcode.content) #接下來balabala對圖像操作,可以用python的相關庫(識別率低,教務網的驗證碼都夠嗆),也可以用云速等第三方驗證碼識別網站提供的有償服務(識別度較高) #再接下來構造表單數據balabala
法2:
用cookie:
#綁定cookie checkcode_url='http://yyy.com' cookie = cookielib.CookieJar() handler = urllib2.HTTPCookieProcessor(cookie) opener = urllib2.build_opener(handler) #先讀取驗證碼的url picture = opener.open(checkcode_url).read() #balabala圖像處理 # 生成post數據 data = urllib.urlencode(postData) # 構造request請求 request = urllib2.Request(PostUrl, data, headers) # 利用之前存有cookie的opener登錄頁面 try: response = opener.open(request) result = response.read() except urllib2.HTTPError, e: print e.code
法3:
selenium+手動構造cookie: 該方法無需識別驗證碼,本人尚未嘗試。
webdriver 操作 cookie 的方法有:
.... #第一次訪問 xxx 網站 driver.get("http://xxx.com") #將用戶名密碼寫入瀏覽器 cookie driver.add_cookie({'name':'username','value':'username'}) driver.add_cookie({'name':'password','value':'password'}) #再次訪問 xxx 網站,將會自動登錄 driver.get("http://xxx.com") time.sleep(5) .... driver.quit()
這種方法難點在于確定該網站是用cookie中的什么key值來表示“用戶名”和“密碼”的。而且好像有些cookie是加密過的。可以先用get_cookies()進行觀察。
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持億速云。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。