您好,登錄后才能下訂單哦!
本篇內容介紹了“怎么用Python datacompy找出兩個DataFrames不同的地方”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
x表:
讓x1和x2都是x的副本,則此時x1和x2的值是相同:
x1=x.copy() x2=x.copy()
將其中x2的一個數據賦值為2000
x2.loc['羅梓烜']['20220125']=2000
x1[x1==x2].head(25) # 如何對不相等的數據進行糾正
此時可以看到下圖這個數據是NaN值,說明對于這個數據來說x1和x2是不相同的
x1[x1==x2].isnull().sum()
下圖說明在20220125
這一列當中存在一個NaN
值,也就是我們剛剛賦值的地方:
但是現在還是不能確定出有異常值(也就是不相等的值的那行數據),因此我們考慮使用datacompy
安裝:
pip install datacompy
import datacompy,pandas as pd,sys compy=datacompy.Compare(x1,x2,on_index=True) compy print(compy.matches()) print(compy.report())
此時就可以很清晰的看到兩個DataFrame當中不相同的值了:
“怎么用Python datacompy找出兩個DataFrames不同的地方”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。