91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

資料分享—— Python 分析拉鉤職位

發布時間:2020-07-01 14:22:11 來源:網絡 閱讀:429 作者:xjtuhit 欄目:編程語言

視頻

PPT+ 視頻

鏈接: https://pan.baidu.com/s/1tzG1adgpn23TSKvnR6XmYg 提取碼: 2p2t

項目代碼:https://github.com/nicksors/JobAnalysis

前言

近年來 Python 之火大家都有感而知,那親們知道北京的 Python 開發崗位、運維開發崗位招聘地域都是如何分布的嗎?薪水如何?是否有前景等等,這些數據呢直接通過招聘信息來了解到企業用人是最直接的,也是最簡單的途徑。

那本次將通過分享 Python 來抓取拉鉤的招聘信息,然后加以分析,做一個北京的 Python 職位地域分布、薪資范圍、福利待遇等維度出一個簡單的分析報告,希望能幫助到想在 Python 這片田地耕耘的童鞋在發展方向上有所參考。

使用到的工具

使用 Python 的 requests 工具到招聘網站爬取我們想要的數據,分析和可視化也使用 Python 的相關模塊來實現,主要有如下:
Python 版本:Python 3.x
requests:發起請求,從網站抓取數據
math:數學運算函數,向上取整,這里主要用于分析數據
time:時間模塊,主要是控制爬蟲不會因為頻繁請求而被網站拉進小黑屋
pandas:數據抓取后使用該模塊保存為 csv 文件到本地
matplotlib:可視化畫圖
pylab:設置畫圖能顯示中文
wordcloud、scipy、jieba(字符串分割成單詞):生成中文詞云

如何進行數據抓取

使用 Chrome 打開拉鉤網站,在網站輸入“Python開發” 職位,使用 “檢查” 功能查看網頁源碼。發現拉鉤有反爬機制,職位信息并不在源代碼里,而是在 JSON 文件里,因此直接通過 JSON 獲取數據即可。
資料分享—— Python 分析拉鉤職位

抓取信息時,需要加上頭部信息,才能獲取到數據。(原理很簡單:你得偽裝成一個 正常的 client 去請求網頁才能拿到想要的數據)


def get_json(url, num):
   '''從網頁獲取JSON,使用POST請求,加上頭部信息'''
   headers = {
       'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36',
       'Host': 'www.lagou.com',

     'Referer':'https://www.lagou.com/jobs/list_python%E5%BC%80%E5%8F%91?labelWords=&;fromSearch=true&suginput=',
       'X-Anit-Forge-Code': '0',
     'X-Anit-Forge-Token': 'None',
     'X-Requested-With': 'XMLHttpRequest'
   }

   data = {
       'first': 'true',
       'pn': num,
       'kd': 'Python開發'}
   res = requests.post(url, headers=headers, data=data)
   res.raise_for_status()
   res.encoding = 'utf-8'
   # 得到包含職位信息的字典
   page = res.json()
   return page

在搜索結果的第一頁,我們可以從 JSON 里讀取總職位數,按照每頁15個職位,獲得要爬取的頁數。再使用循環按頁爬取,將職位信息匯總,輸出為 CSV 格式。

序運行如下:
資料分享—— Python 分析拉鉤職位

抓取結果如下:
資料分享—— Python 分析拉鉤職位

數據可視化畫圖展示

1、根據薪資制作直方圖

薪資比例描述和可視化出圖
資料分享—— Python 分析拉鉤職位

資料分享—— Python 分析拉鉤職位

2、根據崗位地域分布制作餅圖

資料分享—— Python 分析拉鉤職位

3、制作詞云

將職位福利這一列數據進行匯總,按照詞語出現的頻率生成云詞實現 Python 可視化,以下是原圖和云詞圖對比:
資料分享—— Python 分析拉鉤職位

Python 第20期入門班正在火熱招生中

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

齐河县| 汤阴县| 白朗县| 弥渡县| 阳原县| 高安市| 岫岩| 南宁市| 郯城县| 高淳县| 元江| 伊川县| 天镇县| 扎囊县| 中牟县| 阿拉善盟| 长沙市| 关岭| 杭锦后旗| 南平市| 佛冈县| 墨竹工卡县| 榆树市| 孝感市| 武夷山市| 安仁县| 韶山市| 昆明市| 汉源县| 屯昌县| 大关县| 桂平市| 满洲里市| 鹿泉市| 云南省| 余江县| 托克托县| 武山县| 新蔡县| 二连浩特市| 隆化县|