您好,登錄后才能下訂單哦!
摘要
數據分析與建模的時候大部分時間在數據準備上,包括對數據的加載、清理、轉換以及重塑。pandas提供了一組高級的、靈活的、高效的核心函數,能夠輕松的將數據規整化。這節主要對pandas合并數據集的merge函數進行詳解。(用過SQL或其他關系型數據庫的可能會對這個方法比較熟悉。)碼字不易,喜歡請點贊!!!
1.merge函數的參數一覽表
2.創建兩個DataFrame
3.pd.merge()方法設置連接字段。
默認參數how是inner內連接,并且會按照相同的字段key進行合并,即等價于on=‘key'
。
也可以顯示的設置on=‘key',這里也推薦這么做。
當兩邊合并字段不同時,可以使用left_on和right_on參數設置合并字段。當然這里合并字段都是key所以left_on和right_on參數值都是key。
4.pd.merge()方法設置連接方法。
主要包括inner(內連接)、outer(外鏈接)、left(左連接)、right(右連接)。
參數how默認值是inner內連接,上面的都是采用內連接,連接兩邊都有的值。
當采用outer外連接時,會取并集,并用NaN填充。
外連接其實左連接和右連接的并集。左連接是左側DataFrame取全部數據,右側DataFrame匹配左側DataFrame。(右連接right和左連接類似)
5.pd.merge()方法索引連接,以及重復列名命名。
pd.merge()方法可以通過設置left_index或者right_index的值為True來使用索引連接,例如這里df1使用data1當連接關鍵字,而df2使用索引當連接關鍵字。
從上面可以發現兩個DataFrame中都有key列,merge合并之后,pandas會自動在后面加上(_x,_y)來區分,我們也可以通過設置suffixes來設置名字。
總結
以上所述是小編給大家介紹的詳解Python3 pandas.merge用法,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對億速云網站的支持!
如果你覺得本文對你有幫助,歡迎轉載,煩請注明出處,謝謝!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。