您好,登錄后才能下訂單哦!
這篇“Python中pd.concat與pd.merge怎么使用”文章的知識點大部分人都不太理解,所以小編給大家總結了以下內容,內容詳細,步驟清晰,具有一定的借鑒價值,希望大家閱讀完這篇文章能有所收獲,下面我們一起來看看這篇“Python中pd.concat與pd.merge怎么使用”文章吧。
concat 是pandas級的函數,用來拼接或合并數據,其根據不同的軸既可以橫向拼接,又可以縱向拼接
函數參數
pd.concat( objs: 'Iterable[NDFrame] | Mapping[Hashable, NDFrame]', axis=0, join='outer', ignore_index: 'bool' = False, keys=None, levels=None, names=None, verify_integrity: 'bool' = False, sort: 'bool' = False, copy: 'bool' = True, ) -> 'FrameOrSeriesUnion'
objs
:合并的數據集,一般用列表傳入,例如:[df1,df2,df3]
axis
:指定數據拼接時的軸,0是行,在行方向上拼接;1是列,在列方向上拼接
join
:拼接的方式有 inner,或者outer,與sql中的意思一樣
以上三個參數在實際工作中經常使用,其他參數不再做介紹
案例:
模擬數據
橫向拼接
橫向拼接-1
字段相同的列進行堆疊,字段不同的列分列存放,缺失值用NAN
來填充,下面對模擬數據進行變換用相同的字段,進行演示
橫向拼接-2
縱向拼接
縱向拼接
可以看出在縱向拼接的時候,會按索引進行關聯,使相同名字的成績放在一起,而不是簡單的堆疊
數據關聯與SQL中的join基本一樣,一次可以關聯兩個數據表,有左表、右表的區分,需要可以指定關聯的字段
函數參數
pd.merge( left: 'DataFrame | Series', right: 'DataFrame | Series', how: 'str' = 'inner', on: 'IndexLabel | None' = None, left_on: 'IndexLabel | None' = None, right_on: 'IndexLabel | None' = None, left_index: 'bool' = False, right_index: 'bool' = False, sort: 'bool' = False, suffixes: 'Suffixes' = ('_x', '_y'), copy: 'bool' = True, indicator: 'bool' = False, validate: 'str | None' = None, ) -> 'DataFrame'
left
:左表
right
:右表
how
:關聯的方式,{‘left’, ‘right’, ‘outer’, ‘inner’, ‘cross’}, 默認關聯方式為 ‘inner’
on
:關聯時指定的字段,兩個表共有的
left_on
:關聯時用到左表中的字段,在兩個表不共有關聯字段時使用
right_on
:關聯時用到右表中的字段,在兩個表不共有關聯字段時使用
以上參數在實際工作中經常使用,其他參數不再做介紹
案例:
數據關聯
merge 的使用與SQL中的 join 很像,使用方式基本一致,既有內連接,也有外連接,用起來基本沒有什么難度
concat 只是 pandas 下的方法,而 merge 即是 pandas 下的方法,又是DataFrame 下的方法
concat 可以橫向、縱向拼接,又起到關聯的作用
merge 只能進行關聯,也就是縱向拼接
concat 可以同時處理多個數據框DataFrame,而 merge 只能同時處理 2 個數據框
以上就是關于“Python中pd.concat與pd.merge怎么使用”這篇文章的內容,相信大家都有了一定的了解,希望小編分享的內容對大家有幫助,若想了解更多相關的知識內容,請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。