您好,登錄后才能下訂單哦!
這篇文章主要介紹“Python中Dataframe元素為不定長list時的問題怎么解決”的相關知識,小編通過實際案例向大家展示操作過程,操作方法簡單快捷,實用性強,希望這篇“Python中Dataframe元素為不定長list時的問題怎么解決”文章能幫助大家解決問題。
本文想要解決的問題是當DataFrame中某一列元素為不定長度的數組時,該如何對它們進行拆分分解為后續元素,從而進行進一步的提取操作,數據格式見下圖:
這個問題的解決思路首先是要不定長的數組填充成等長的數組,從而后續可以直接轉換為元素為單一值的標準DataFrame,再和原DataFrame合并即可完成操作。填充的部分使用了map()
方法來實現,實現前還需要獲得數組的最大長度以確定填充數目。代碼見下:
a=[[['a','d'],['b'],['a','c']],[1,2,3],[4,5,6]] df=pd.DataFrame(a).T used_col=df[0] length=used_col.map(lambda x:len(x)) max_l=length.max() temp=used_col.map(lambda x:x+[np.nan]*(max_l-len(x))) temp=np.array(temp.to_list()) temp=pd.DataFrame(temp) df=df.drop(0,axis=1) temp.columns=['cat1','cat2'] output=df.join(temp)
結果展示:
pd.DataFrame(a).T
Out[13]:
0 1 2
0 [a, d] 1 4
1 [b] 2 5
2 [a, c] 3 6
output
Out[14]:
1 2 cat1 cat2
0 1 4 a d
1 2 5 b nan
2 3 6 a c
關于“Python中Dataframe元素為不定長list時的問題怎么解決”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識,可以關注億速云行業資訊頻道,小編每天都會為大家更新不同的知識點。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。