91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python如何爬取NBA虎撲球員數據

發布時間:2021-10-26 09:38:56 來源:億速云 閱讀:295 作者:柒染 欄目:大數據

這篇文章給大家介紹Python如何爬取NBA虎撲球員數據,內容非常詳細,感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。

虎撲是一個認真而有趣的社區,每天有眾多JRs在虎撲分享自己對籃球、足球、游戲電競、運動裝備、影視、汽車、數碼、情感等一切人和事的見解,熱鬧、真實、有溫度。

受害者地址

https://nba.hupu.com/stats/players

Python如何爬取NBA虎撲球員數據

本文知識點:

  • 系統分析網頁性質

  • 結構化的數據解析

  • csv數據保存

環境介紹:

  • python 3.6

  • pycharm

  • requests

  • csv

爬蟲案例的一般步驟

  • 1.確定url地址(網頁分析) 完成一半

  • 2.發送網絡請求 requests(js\html\css)

  • 3.數據解析(篩選數據)

  • 4.保存數據(本地文件\數據庫)

部分代碼

導入工具

import requests  # 第三方工具
import parsel  # 數據解析工具  (css\正則表達式\xpath)
import csv

確定url地址(網頁分析) 完成一半 (靜態網頁\動態網頁)

url = 'https://nba.hupu.com/stats/players/pts/{}'.format(page)

發送網絡請求 requests(js\html\css)

response = requests.get(url=url)
html_data = response.text

數據解析(篩選數據)

selector = parsel.Selector(html_data)
    trs = selector.xpath('//tbody/tr[not(@class="color_font1 bg_a")]')
    for tr in trs:
        rank = tr.xpath('./td[1]/text()').get()  # 排名
        player = tr.xpath('./td[2]/a/text()').get()  # 球員
        team = tr.xpath('./td[3]/a/text()').get()  # 球隊
        score = tr.xpath('./td[4]/text()').get()  # 得分
        hit_shot = tr.xpath('./td[5]/text()').get()  # 命中-出手
        hit_rate = tr.xpath('./td[6]/text()').get()  # 命中率
        hit_three = tr.xpath('./td[7]/text()').get()  # 命中-三分
        three_rate = tr.xpath('./td[8]/text()').get()  # 三分命中率
        hit_penalty = tr.xpath('./td[9]/text()').get()  # 命中-罰球
        penalty_rate = tr.xpath('./td[10]/text()').get()  # 罰球命中率
        session = tr.xpath('./td[11]/text()').get()  # 場次
        playing_time = tr.xpath('./td[12]/text()').get()  # 上場時間
        print(rank, player, team, score, hit_shot, hit_rate, hit_three,
              three_rate, hit_penalty, penalty_rate, session, playing_time)

        data_dict = {
            '排名': rank, '球員': player, '球隊': team, '得分': score,
            '命中-出手': hit_shot, '命中率': hit_rate, '命中-三分': hit_three, '三分命中率': three_rate,
            '命中-罰球': hit_penalty, '罰球命中率': penalty_rate, '場次': session, '上場時間': playing_time}

        csv_write.writerow(data_dict)
				
        #  想要完整源碼的同學可以關注我的公眾號:松鼠愛吃餅干
        #  回復“虎撲NBA”即可免費獲取

運行代碼,效果如下

Python如何爬取NBA虎撲球員數據

關于Python如何爬取NBA虎撲球員數據就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

论坛| 天津市| 绿春县| 泰顺县| 东明县| 双桥区| 湘潭县| 扎囊县| 永川市| 民勤县| 花莲市| 桂平市| 阜新市| 错那县| 榆社县| 忻城县| 德江县| 林周县| 化德县| 莱西市| 吴川市| 罗江县| 丰原市| 伊春市| 昆山市| 铜鼓县| 湘潭县| 塔河县| 太湖县| 延庆县| 都兰县| 中宁县| 新乡县| 友谊县| 屏山县| 宿松县| 阿克苏市| 新安县| 山阴县| 庄浪县| 安吉县|