91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

基于Python怎么實現對比Exce的工具

發布時間:2022-04-07 13:40:57 來源:億速云 閱讀:137 作者:iii 欄目:開發技術

這篇“基于Python怎么實現對比Exce的工具”文章的知識點大部分人都不太理解,所以小編給大家總結了以下內容,內容詳細,步驟清晰,具有一定的借鑒價值,希望大家閱讀完這篇文章能有所收獲,下面我們一起來看看這篇“基于Python怎么實現對比Exce的工具”文章吧。

1.參數

  • 同一個excel文件兩個sheet頁其中一個ODS(老數據),一個DWH(新數據)

  • 生成對比文件

  • 設計兩個主鍵 輸入主鍵1 輸入主鍵2

(默認新舊文件列名一致)

2.效果

  • 生成的文件

  • 數據量一樣、取每個字段不一致的數據前10

  • 數據量不一樣、取兩邊不一樣的數據前10、排除不一樣的數據、每個字段不一致的數據前10

3.實現

  • 循環對比組合列(主鍵+對比列)

  • pandas處理差異數據、openpyxl 處理生成的sheet的數據格式. (先生成數據,然后調整格式)

配置

import pandas as pd
from openpyxl import load_workbook
#選擇文件路徑
path=r"C:\Users\小管同學\Desktop\Migration_Data_Compari\對比文件.xls" #input("選擇文件路徑:")
TargetPath=r"C:\Users\小管同學\Desktop\Migration_Data_Comparison_Tool\目標文件\對比結果.xlsx"
DATA_ODS=pd.read_excel(r"C:\Users\小管同學\Desktop\Migration_Data_Comparison_Tool\對比文件.xls",sheet_name="ODS")
DATA_DWH=pd.read_excel(r"C:\Users\小管同學\Desktop\Migration_Data_Comparison_Tool\對比文件.xls",sheet_name="DWH")
#選擇主鍵
Primarykey="員工編號"#input("選擇主鍵1:")
Primarykey
# 員工編號

一、數據量

輸出表格1–數據量

def write_to_excel_DataVolume(Data,TargetPath): # cor_df 為要保存的 dataframe 
    writer = pd.ExcelWriter(TargetPath, engine='xlsxwriter') # 這里用
    Data.to_excel(writer,sheet_name='Sheet1', encoding='utf8', header=False, startcol=0, startrow=2) # 把dataframe的數據從第2行開始
    workbook  = writer.book
    
    format1 = workbook.add_format({ # 先把樣式打包,然后之后賦值即可
        'bold': True, # 字體加粗
        'text_wrap': True, # 是否自動換行
        'valign': 'bottom',  #垂直對齊方式
        'align': 'center', # 水平對齊方式
        'fg_color': '#C5D9F1', # 單元格背景顏色
        'border': 1,# 邊框
    })    
    writer_sheet = writer.sheets['Sheet1']
    # 設置寬度
    writer_sheet.set_column("A:I", 16)
    writer_sheet.set_column('C:C',30)
    writer_sheet.merge_range(0,0,0,2,'對比結果',format1)
    writer_sheet.merge_range(4,2,4,0,'數據量差異',format1)
    writer_sheet.write(1,0,'',format1)
    writer_sheet.write(1,1,'ODS',format1)
    writer_sheet.write(1,2,'DWH',format1)
    writer.save()
    writer.close()
DataFrame_DataVolume=pd.DataFrame([[DATA_ODS.shape[0]],[DATA_DWH.shape[0]]]).T
DataFrame_DataVolume.columns =["ODS","DWH"]
DataFrame_DataVolume.index=["數據量"]
DataFrame_DataVolume
#writeFileDataVolume(DataFrame_DataVolume,TargetPath)
write_to_excel_DataVolume(DataFrame_DataVolume,TargetPath)

基于Python怎么實現對比Exce的工具

輸出表格2–數據量差異合同

if DATA_ODS.shape[0]==DATA_DWH.shape[0]:
    pass
else:
    
    DATA_ODS_Primarykey=pd.DataFrame(DATA_ODS[Primarykey])
    DATA_DWH_Primarykey=pd.DataFrame(DATA_DWH[Primarykey])
    df_union = pd.concat([DATA_ODS_Primarykey,DATA_DWH_Primarykey])
    # 實現1
    df_diff_ODS = df_union.append(DATA_ODS_Primarykey).drop_duplicates(subset=df_union.columns.to_list(), keep=False)
    df_diff_DWH = df_union.append(DATA_DWH_Primarykey).drop_duplicates(subset=df_union.columns.to_list(), keep=False)
    #DWH多的合同
    df_diff_ODS
    #DWH少的合同
    df_diff_DWH
    df_diff_DWH_Data=[]
    df_diff_ODS_Data=[]
    for i in df_diff_ODS.head(10).values.tolist():
        for n in i:
            df_diff_ODS_Data.append(n)
            
    for i in df_diff_DWH.head(10).values.tolist():
            df_diff_DWH_Data.append(n)
    while True:
        if len(df_diff_DWH_Data)>len(df_diff_ODS_Data):
            df_diff_ODS_Data.append("-")
        elif len(df_diff_DWH_Data)< len(df_diff_ODS_Data):
            df_diff_DWH_Data.append("-")
        elif len(df_diff_DWH_Data)== len(df_diff_ODS_Data):
            break
    DataFrame_DataVolume_Count_result=pd.DataFrame(df_diff_DWH_Data,df_diff_ODS_Data).reset_index()
    DataFrame_DataVolume_Count_result.columns=['DWH多的合同','DWH少的的合同']
    DataFrame_DataVolume_Count_result=DataFrame_DataVolume_Count_result.reset_index()
    DataFrame_DataVolume_Count_result.columns=['序號','DWH多的合同','DWH少的的合同']
DataFrame_DataVolume_Count_result
from openpyxl import load_workbook
 
def write_to_excel_Count_result(Data,TargetPath):
    df_Old = pd.DataFrame(pd.read_excel(TargetPath)) #讀取原數據文件和表 
    writer = pd.ExcelWriter(TargetPath,engine='openpyxl')
    book=load_workbook(TargetPath)
    writer.book = book
    writer.sheets = dict((ws.title, ws) for ws in book.worksheets)
    df_rows = df_Old.shape[0] #獲取原數據的行數
    Data.to_excel(writer,startrow=df_rows+1, index=False,startcol=0,header=True)#將數據寫入excel中的aa表,從第一個空行開始寫
    writer.save()#保存
write_to_excel_Count_result(DataFrame_DataVolume_Count_result,TargetPath)

基于Python怎么實現對比Exce的工具

以上就是關于“基于Python怎么實現對比Exce的工具”這篇文章的內容,相信大家都有了一定的了解,希望小編分享的內容對大家有幫助,若想了解更多相關的知識內容,請關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

敦化市| 库尔勒市| 连城县| 黑龙江省| 孟州市| 安顺市| 稻城县| 鹿邑县| 麻城市| 遂川县| 莆田市| 敖汉旗| 中卫市| 蚌埠市| 天镇县| 乳源| 邹城市| 泰来县| 北流市| 正蓝旗| 安多县| 互助| 朝阳市| 江门市| 哈巴河县| 辽中县| 诸城市| 许昌县| 乐业县| 安阳市| 五莲县| 当涂县| 浮山县| 城固县| 阆中市| 安福县| 开原市| 绥德县| 新余市| 宁强县| 桦南县|