您好,登錄后才能下訂單哦!
這篇文章主要介紹“Python數據分析過程是怎樣的”的相關知識,小編通過實際案例向大家展示操作過程,操作方法簡單快捷,實用性強,希望這篇“Python數據分析過程是怎樣的”文章能幫助大家解決問題。
該需求主要是分析某一種數據的歷史數據。
客戶的需求是根據該數據的前兩期的情況,如果存在某個斜著的兩個數字相等,那么就買第三期的同一個位置處的彩票,
對于1、,如果相等的數字是:1-5,那就買6-10,如果相等的數字是:6-10,那就買1-5;
對于2、,如果相等的數字是:1-5,那就買1-5,如果相等的數字是:6-10,,那就買6-10。
然后,根據這個方案,有可能會買中,但是也有可能買不中,于是,客戶希望我可以統計出來在100天中,按照這種方法,連續6次以及6次以上的購買彩票才能夠命中一次獎的次數以及分別所對應的時間,對于這個案例,我們下面詳細分析。
(在這里,我們先利用 Jupyter Notebook 來進行分析,然后,在得到成果以后,利用 Pycharm 來進行完整的程序設計。)
打開如下圖所示的界面可以獲取到網址以及請求頭:
1、網址(歷史數據的網址)
2、請求頭
然后我們在程序中進行代碼書寫獲取數據:
然后進行一定的預處理:
這里我們直接展示代碼:
def reverse_list(lst): """ 準換列表的先后順序 :param lst: 原始列表 :return: 新的列表 """ return [ele for ele in reversed(lst)] low_list = ["01", "02", "03", "04", "05"] # 設置比較小的數字的列表 high_list = ["06", "07", "08", "09", "10"] # 設置比較大的數字的列表 N = 0 # 設置一個數字N來記錄一共有多少期可以購買 n = 0 # 設置一個數字n來記錄命中了多少期彩票 record_number = 1 # 設置記錄數據的一個判斷值 list_data_number = [] # 設置一個空的列表來存儲一天之中的連續掛掉的期數 dict_time_record = {} # 設置一個空的字典來存儲連掛掉的期數滿足所列條件的時間節點 for k in range(1152): # 循環遍歷所有的數據點 if k < 1150: new_result1 = reverse_list(new_response["result"]["data"])[k] # 第一期數據 new_result2 = reverse_list(new_response["result"]["data"])[k + 1] # 第二期數據 new_result3 = reverse_list(new_response["result"]["data"])[k + 2] # 第三期數據 data1 = new_result1['preDrawCode'].split(',') # 第一期數據 data2 = new_result2['preDrawCode'].split(',') # 第二期數據 data3 = new_result3['preDrawCode'].split(',') # 第三期數據 for m in range(10): # 通過循環來判斷是否滿足購買的條件,并且實現一定的功能 if m == 0: if data2[0] == data1[1]: # 如果相等就要結束循環 N += 1 # 可以購買的期數應該要自加一 if (data2[0] in low_list and data3[0] in low_list) or (data2[0] in high_list and data3[0] in high_list): n += 1 # 命中的期數應該要自加一 # 如果命中了的話,本輪結束,開啟下一輪 list_data_number.append(record_number) if f"{record_number}" in dict_time_record.keys(): # 如果已經有了這個鍵,那么值添加時間點 dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:]) else: # 如果沒有這個鍵,那么添加一個鍵值對,值為一個列表,而且初始化為當前的時間 dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]] record_number = 1 # 初始化下一輪的開始 else: record_number += 1 # 如果沒有命中的話,次數就應該要自加一 break # 如果滿足相等的條件就要結束循環 elif m == 9: # 與上面差不多的算法 if data2[9] == data1[8]: # 如果相等 N += 1 if (data2[9] in low_list and data3[9] in low_list) or (data2[9] in high_list and data3[9] in high_list): n += 1 list_data_number.append(record_number) if f"{record_number}" in dict_time_record.keys(): dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:]) else: dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]] record_number = 1 else: record_number += 1 break else: # 與上面差不多的算法 if data2[m] == data1[m + 1] or data2[m] == data1[m - 1]: # 如果相等 N += 1 if (data2[m] in low_list and data3[m] in low_list) or (data2[m] in high_list and data3[m] in high_list): n += 1 list_data_number.append(record_number) if f"{record_number}" in dict_time_record.keys(): dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:]) else: dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]] record_number = 1 else: record_number += 1 break print(f"日期:{new_response['result']['data'][0]['preDrawTime'][:10]},總的梯子數為{N}個,一共有{n}次命中,一共有{N - n}次掛了") # 打印時間,以及,可以購買的期數,命中的期數,沒有命中的期數 list_data_number.sort() # 按照大小順序來進行排序 dict_record = {} # 設置空字典進行記錄 for i in list_data_number: if f"{i}" in dict_record.keys(): # 判斷是否已經有了這個數字? dict_record[f"{i}"] += 1 # 如果有的話,那么就會自加一 else: # 如果沒有的話,那么就會創建并且賦值等于 1 dict_record[f"{i}"] = 1 # 創建一個新的字典元素,然后進行賦值為 1 for j in dict_record.keys(): if (int(j) >= 6) and (int(j) < 15): # 實際的結果表明,我們需要的是大于等于6期的數據,而沒有出現大于15的數據,因此有這樣的一個關系式 print(f"買{j}次才中獎的次數為{dict_record[j]}") # 打印相關信息 print(dict_time_record[j]) str0 = "" for letter in dict_time_record[j]: str0 += letter str0 += ", " print(str0) # 打印相關信息
運行結果的展示如下圖所示:
首先設置一個事件列表來記錄需要統計哪些天的數據:
代碼:
data_list = [] for h in range(31): data_list.append(f'1-{h + 1}') for h in range(28): data_list.append(f'2-{h + 1}') for h in range(31): data_list.append(f'3-{h + 1}') for h in range(20): data_list.append(f'4-{h + 1}')
通過上述的代碼,我們即實現了時間列表的設置,然后我們循環遍歷這個列表訪問不同日期的彩票數據即就是得到了不同時間的數據,然后再利用上述的分析方法來進行數據分析,即就是可以得到了多天的彩票數據分析的結果了。
這里我們可以采用xlwt 模塊來進行excel表格的寫入操作啦,具體的寫入就不必過多贅述了。
一下是完整的代碼:
import requests import chardet import json import xlwt # excel 表格數據處理的對應模塊 def reverse_list(lst): """ 準換列表的先后順序 :param lst: 原始列表 :return: 新的列表 """ return [ele for ele in reversed(lst)] data_list = [] for h in range(31): data_list.append(f'1-{h + 1}') for h in range(28): data_list.append(f'2-{h + 1}') for h in range(31): data_list.append(f'3-{h + 1}') for h in range(20): data_list.append(f'4-{h + 1}') wb = xlwt.Workbook() # 創建 excel 表格 sh = wb.add_sheet('彩票分析數據處理') # 創建一個 表單 sh.write(0, 0, "日期") sh.write(0, 1, "梯子數目") sh.write(0, 2, "命中數目") sh.write(0, 3, "掛的數目") sh.write(0, 4, "6次中的數目") sh.write(0, 5, "6次中的時間") sh.write(0, 6, "7次中的數目") sh.write(0, 7, "7次中的時間") sh.write(0, 8, "8次中的數目") sh.write(0, 9, "8次中的時間") sh.write(0, 10, "9次中的數目") sh.write(0, 11, "9次中的時間") sh.write(0, 12, "10次中的數目") sh.write(0, 13, "10次中的時間") sh.write(0, 14, "11次中的數目") sh.write(0, 15, "11次中的時間") sh.write(0, 16, "12次中的數目") sh.write(0, 17, "12次中的時間") sh.write(0, 18, "13次中的數目") sh.write(0, 19, "13次中的時間") sh.write(0, 20, "14次中的數目") sh.write(0, 21, "14次中的時間") # wb.save('test4.xls') sheet_seek_position = 1 # 設置表格的初始位置為 1 for data in data_list: low_list = ["01", "02", "03", "04", "05"] high_list = ["06", "07", "08", "09", "10"] N = 0 n = 0 url = f'https://api.api68.com/pks/getPksHistoryList.do?date=2021-{data}&lotCode=10037' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) ' 'AppleWebKit/537.36 (KHTML, like Gecko) ' 'Chrome/90.0.4430.72 Safari/537.36' } response = requests.get(url=url, headers=headers) response.encoding = chardet.detect(response.content)['encoding'] new_response = json.loads(response.text) sh.write(sheet_seek_position, 0, new_response['result']['data'][0]['preDrawTime'][:10]) # 在表格的第一個位置處寫入時間,意即:data record_number = 1 # 記錄數據的一個判斷值,設置為第一次,應該是要放在最外面的啦 list_data_number = [] # 設置一個空列表來存儲一天之中的連續掛的期數 dict_time_record = {} for k in range(1152): # record_number = 1,應該要放外面 # 記錄數據的一個判斷值,設置為第一次 if k < 1150: new_result1 = reverse_list(new_response["result"]["data"])[k] new_result2 = reverse_list(new_response["result"]["data"])[k + 1] new_result3 = reverse_list(new_response["result"]["data"])[k + 2] data1 = new_result1['preDrawCode'].split(',') data2 = new_result2['preDrawCode'].split(',') data3 = new_result3['preDrawCode'].split(',') for m in range(10): if m == 0: if data2[0] == data1[1]: N += 1 if (data2[0] in low_list and data3[0] in high_list) or (data2[0] in high_list and data3[0] in low_list): n += 1 # 如果命中了的話,本輪結束,開啟下一輪 list_data_number.append(record_number) if f"{record_number}" in dict_time_record.keys(): dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:]) else: dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]] # print(record_number) record_number = 1 # 初始化 else: record_number += 1 # 沒中,次數加一 # 自加一 break elif m == 9: if data2[9] == data1[8]: N += 1 if (data2[9] in low_list and data3[9] in high_list) or (data2[9] in high_list and data3[9] in low_list): n += 1 list_data_number.append(record_number) if f"{record_number}" in dict_time_record.keys(): dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:]) else: dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]] # print(record_number) record_number = 1 else: record_number += 1 break else: if data2[m] == data1[m + 1] or data2[m] == data1[m - 1]: N += 1 if (data2[m] in low_list and data3[m] in high_list) or (data2[m] in high_list and data3[m] in low_list): n += 1 list_data_number.append(record_number) if f"{record_number}" in dict_time_record.keys(): dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:]) else: dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]] # print(record_number) record_number = 1 else: record_number += 1 break print(f"日期:{new_response['result']['data'][0]['preDrawTime'][:10]},總的梯子數為{N}個,一共有{n}次命中,一共有{N - n}次掛了") sh.write(sheet_seek_position, 1, N) sh.write(sheet_seek_position, 2, n) sh.write(sheet_seek_position, 3, N - n) # new_list_data_number = list_data_number.sort() list_data_number.sort() # 進行排序 dict_record = {} # 設置空字典 for i in list_data_number: if f"{i}" in dict_record.keys(): # 判斷是否已經有了這個數字? dict_record[f"{i}"] += 1 # 如果有的話,那么就會自加一 else: # 如果沒有的話,那么就會創建并且賦值等于 1 dict_record[f"{i}"] = 1 # 創建一個新的字典元素,然后進行賦值為 1 # print(dict_record) # print(f"買彩票第幾次才中獎?") # print(f"按照我們的規律買彩票的情況:") for j in dict_record.keys(): if (int(j) >= 6) and (int(j) < 15): print(f"買{j}次才中獎的次數為{dict_record[j]}") print(dict_time_record[j]) str0 = "" for letter in dict_time_record[j]: str0 += letter str0 += ", " print(str0) sh.write(sheet_seek_position, 4 + (int(j) - 6) * 2, dict_record[j]) # 寫入幾次 sh.write(sheet_seek_position, 4 + (int(j) - 6) * 2 + 1, str0[:-2]) # 注意這里應該要改為 -2 # 寫入幾次對應的時間 # print(j) sheet_seek_position += 1 # 每次寫完了以后,要對位置進行換行,換到下一行,從而方便下一行的寫入 # 保存 wb.save('極速飛艇彩票分析結果.xls')
運行結果展示:
展示1、
展示2、
從而,我們便解決了極速飛艇的彩票的數據分析
然后,我們只需要稍稍改變一點點算法,其他的部分是完全一樣的啦,從而即就是可以實現極速賽車的數據分析了啦。
修改的代碼在下面列出來了:
for m in range(10): if m == 0: if data2[0] == data1[1]: N += 1 if (data2[0] in low_list and data3[0] in low_list) or (data2[0] in high_list and data3[0] in high_list): n += 1 # 如果命中了的話,本輪結束,開啟下一輪 list_data_number.append(record_number) if f"{record_number}" in dict_time_record.keys(): dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:]) else: dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]] # print(record_number) record_number = 1 # 初始化 else: record_number += 1 # 沒中,次數加一 # 自加一 break elif m == 9: if data2[9] == data1[8]: N += 1 if (data2[9] in low_list and data3[9] in low_list) or (data2[9] in high_list and data3[9] in high_list): n += 1 list_data_number.append(record_number) if f"{record_number}" in dict_time_record.keys(): dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:]) else: dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]] # print(record_number) record_number = 1 else: record_number += 1 break else: if data2[m] == data1[m + 1] or data2[m] == data1[m - 1]: N += 1 if (data2[m] in low_list and data3[m] in low_list) or (data2[m] in high_list and data3[m] in high_list): n += 1 list_data_number.append(record_number) if f"{record_number}" in dict_time_record.keys(): dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:]) else: dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]] # print(record_number) record_number = 1 else: record_number += 1 break
關于“Python數據分析過程是怎樣的”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識,可以關注億速云行業資訊頻道,小編每天都會為大家更新不同的知識點。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。