91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python爬取12306車次信息的案例

發布時間:2020-08-13 11:39:28 來源:億速云 閱讀:255 作者:小新 欄目:開發技術

這篇文章主要介紹了Python爬取12306車次信息的案例,具有一定借鑒價值,需要的朋友可以參考下。希望大家閱讀完這篇文章后大有收獲。下面讓小編帶著大家一起了解一下。

詳情查看下面的代碼:

如果被識別就要添加一個cookie如果沒有被識別的話就要一個user—agent就好了。如果出現亂碼就設置編碼格式為utf-8

#靜態的數據一般在elements中(復制文字到sources按ctrl+f搜索。找到的為靜態),而動態去network中去尋找相關的信息
import requests
import re
def send_request():
  headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36'
        ,'Cookie':'_uab_collina=159618052151589201474313; JSESSIONID=D33C89D8BEC6A692C79CFA69FC0B0D29; BIGipServerotn=233832970.24610.0000; BIGipServerpool_passport=216859146.50215.0000; RAIL_EXPIRATION=1596443951465; RAIL_DEVICEID=nMo94O2Z21cXLblW7otLoxUZ_LP9Q01PYj_I89OqU6MqjxyX9814Jc3CH5TNwgBVJqnBaBG8OGiBWo2QtNcu5wVu-asNk6YLa49g0fMwVp03XFJQ-GkhHYHcqIgUd-nqQB_VEdWH1Om_D2yAgIu8QcEavt02pmH5; route=c5c62a339e7744272a54643b3be5bf64; _jc_save_fromStation=%u5317%u4EAC%2CBJP; _jc_save_toStation=%u5929%u6D25%2CTJP; _jc_save_fromDate=2020-07-31; _jc_save_toDate=2020-07-31; _jc_save_wfdc_flag=dc'}#創建頭部信息
  url='https://kyfw.12306.cn/otn/leftTicket/query?leftTicketDTO.train_date=2020-07-31&leftTicketDTO.from_station=BJP&leftTicketDTO.to_station=TJP&purpose_codes=ADULT'
  #設置編碼格式。防止亂碼
  resp=requests.get(url,headers=headers)
  resp.encoding='utf-8'
  return resp

#解析數據
#{}是字典。根據key獲取值。
def parse_json(resp,city):
  json_ticket=resp.json()#將相應的數據轉換為json
  data_list=json_ticket['data']['result']#得到車次的列表
  lst=[]#列表
  for item in data_list:
    #遍歷車次信息進行分割
    d=item.split('|')
    lst.append([d[3],city[d[6]],city[d[7]],d[31],d[30],d[13]])
  return lst
'''
d[3]從列表中獲取索引為3的表示車次
d[6]查詢起始站
d[7]查詢到達站
d[31]一等座
d[30]表示二等座
d[13]表示出行時間'''
#獲得station_name的信息
def get_city():
  url='https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.9151'
  headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36'}
  resp=requests.get(url,headers=headers)
  resp.encoding='utf-8'
  #進行數據的提取(只要一部分)
  stations=re.findall('([\u4e00-\u9fa5]+)\|([A-Z]+)',resp.text)
  #將列表進行轉換為字典
  stations_data=dict(stations)
  #key與value進行互換
  station_d={}#空字典。用于完成上述操作
  for item in stations_data:
    station_d[stations_data[item]]=item
  #print(station_d)
  return station_d

def start():
  lst=parse_json(send_request(),get_city())
  #進行數據的篩選(得到有效的數據)
  for i in lst:
    if i[3]!='無' and i[3]!='':
      print(i)
if __name__=='__main__':
  start() #開始

運行的截圖:

Python爬取12306車次信息的案例

感謝你能夠認真閱讀完這篇文章,希望小編分享Python爬取12306車次信息的案例內容對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,遇到問題就找億速云,詳細的解決方法等著你來學習!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

分宜县| 北海市| 宝应县| 丰原市| 宜阳县| 丰台区| 星子县| 尚志市| 威远县| 格尔木市| 德安县| 富宁县| 枣阳市| 莫力| 门头沟区| 阳春市| 油尖旺区| 惠安县| 钟山县| 湟源县| 新乐市| 明溪县| 垦利县| 葫芦岛市| 正蓝旗| 鄂尔多斯市| 鹿泉市| 玛沁县| 靖边县| 大英县| 如皋市| 眉山市| 玉环县| 龙州县| 兰坪| 乐平市| 惠来县| 桃园县| 大庆市| 靖远县| 九江县|