您好,登錄后才能下訂單哦!
這篇文章給大家介紹Python 中如何使用apply函數,內容非常詳細,感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。
apply函數是pandas里面所有函數中自由度最高的函數。該函數如下:
DataFrame.apply(func, axis=0, broadcast=False, raw=False, reduce=None, args=(), **kwds)
該函數最有用的是第一個參數,這個參數是函數,相當于C/C++的函數指針。
這個函數需要自己實現,函數的傳入參數根據axis來定,比如axis = 1,就會把一行數據作為Series的數據 結構傳入給自己實現的函數中,我們在函數中實現對Series不同屬性之間的計算,返回一個結果,則apply函數 會自動遍歷每一行DataFrame的數據,最后將所有結果組合成一個Series數據結構并返回。
import numpy as npimport pandas as pd f = lambda x: x.max()-x.min() df = pd.DataFrame(np.random.randn(4,3),columns=list('bde'),index=['utah', 'ohio', 'texas', 'oregon'])print(df) t1 = df.apply(f)print(t1) t2 = df.apply(f, axis=1)print(t2)
輸出結果如下所示:
b d e utah 1.106486 0.101113 -0.494279ohio 0.955676 -1.889499 0.522151texas 1.891144 -0.670588 0.106530oregon -0.062372 0.991231 0.294464b 1.953516d 2.880730e 1.016430dtype: float64 utah 1.600766ohio 2.845175texas 2.561732oregon 1.053603dtype: float64
df = pd.DataFrame({'a': np.random.randn(6), 'b': ['foo', 'bar'] * 3, 'c': np.random.randn(6)})def my_test(a, b): return a + bprint(df) df['Value'] = df.apply(lambda row: my_test(row['a'], row['c']), axis=1) # 方法1print(df) df['Value2'] = df['a'] + df['c'] # 方法2print(df)
輸出結果如下:
a b c 0 -1.194841 foo 1.648214 1 -0.377554 bar 0.496678 2 1.524940 foo -1.245333 3 -0.248150 bar 1.526515 4 0.283395 foo 1.282233 5 0.117674 bar -0.094462 a b c Value 0 -1.194841 foo 1.648214 0.453374 1 -0.377554 bar 0.496678 0.119124 2 1.524940 foo -1.245333 0.279607 3 -0.248150 bar 1.526515 1.278365 4 0.283395 foo 1.282233 1.565628 5 0.117674 bar -0.094462 0.023212 a b c Value Value2 0 -1.194841 foo 1.648214 0.453374 0.453374 1 -0.377554 bar 0.496678 0.119124 0.119124 2 1.524940 foo -1.245333 0.279607 0.279607 3 -0.248150 bar 1.526515 1.278365 1.278365 4 0.283395 foo 1.282233 1.565628 1.565628 5 0.117674 bar -0.094462 0.023212 0.023212
注意:當數據量很大時,對于簡單的邏輯處理建議方法2(個人處理幾百M數據集時,方法1花時200s左右,方法2花時10s)!!!
關于Python 中如何使用apply函數就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。