91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python網絡爬蟲信息提取mooc代碼的示例分析

發布時間:2021-06-16 15:17:58 來源:億速云 閱讀:111 作者:小新 欄目:開發技術

這篇文章主要為大家展示了“Python網絡爬蟲信息提取mooc代碼的示例分析”,內容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領大家一起研究并學習一下“Python網絡爬蟲信息提取mooc代碼的示例分析”這篇文章吧。

實例一--爬取頁面

import requests
url="https//itemjd.com/2646846.html"
try:
 r=requests.get(url)
 r.raise_for_status()
 r.encoding=r.apparent_encoding
 print(r.text[:1000])
except:
 print("爬取失敗")

正常頁面爬取

實例二--爬取頁面

import requests
url="https://www.amazon.cn/gp/product/B01M8L5Z3Y"
try:
 kv={'user-agent':'Mozilla/5.0'}
 r=requests.get(url,headers=kv)
 r.raise_for_status()
 r.encoding=r.apparent_encoding
 print(r.text[1000:2000])
except:
 print("爬取失敗")

對訪問用戶名有限制,模擬瀏覽器對網站請求

實例三--爬取搜索引擎

#百度的關鍵詞接口:http://www.baidu.com/s?wd=keyword
#360的關鍵詞接口:http://www.so.com/s?q=keyword
import requests
keyword="python"
try:
 kv={'wd':keyword}
 r=requests.get("http://www.baidu.com/s",params=kv)
 print(r.request.url)
 r.raise_for_status()
 print(len(r.text))
except:
 print("爬取失敗")
--------------------------------------------------
import requests
keyword="python"
try:
 kv={'q':keyword}
 r=requests.get("http://www.so.com/s",params=kv)
 print(r.request.url)
 r.raise_for_status()
 print(len(r.text))
except:
 print("爬取失敗")

實例四--:爬取圖片

import requests
import os
url="https://cache.yisu.com/upload/information/20200622/113/9454.jpg"
root="F://pics//"
path=root+url.split('/')[-1]
try:
 if not os.path.exists(root):
  os.mkdir(root)
 if not os.path.exists(path):
  r=requests.get(url)
  with open(path,'wb') as f:
   f.write(r.content)
   f.close()
   print("文件保存成功")
 else:
  print("文件已經存在")
except:
 print("爬取失敗")

爬取并保存圖片

實例五--IP地址歸屬地查詢:

http://m.ip138.com/ip.asp?ip=ipaddress

url="http://www.ip138.com/iplookup.asp?ip="
try:
 r=requests.get(url+'202.204.80.112'+'&action=2')
 r.raise_for_status()
 r.encoding=r.apparent_encoding
 print(r.text[-500:])
except:
 print("爬取失敗")

以上是“Python網絡爬蟲信息提取mooc代碼的示例分析”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

泌阳县| 金山区| 巴东县| 凭祥市| 鲁山县| 定州市| 大竹县| 道真| 新乡县| 保山市| 合肥市| 保亭| 张家口市| 钟祥市| 禹城市| 珠海市| 金沙县| 石景山区| 鞍山市| 珲春市| 德钦县| 定结县| 襄樊市| 萝北县| 新源县| 松潘县| 夏津县| 固阳县| 绥阳县| 胶南市| 班玛县| 大渡口区| 盘锦市| 金川县| 天台县| 蒲城县| 宝山区| 天门市| 合山市| 巴楚县| 汽车|