您好,登錄后才能下訂單哦!
本篇內容介紹了“Pandas中df.loc[]與df.iloc[]怎么使用”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
取數: 從dataframe中取 一部分行與列的數據 (為主)
賦值: 給指定的 行與列賦值 df.loc[xx,xx] = xx
方括號內的參數:
loc、iloc 方括號中,參數的排布模式為[行條件,列條件],當總體條件只有一個時候(最外層方括號內無逗號),會按照:先行后列的方法來匹配對應的條件
默認會拋棄掉對應的dataframe格式,輸出series,如果想保留dataframe格式,需要在條件外邊加 ”[ ]”。
loc與iloc條件(行/列)相同之處:
單一元素(不包含list) str/int/slice 選取行時候,選取的是對應條件下的行 (series)
單一元素(不包含list) str/int/slice 選取列時候,選取的是對應條件下的列(series)
條件為list時候,選取的是一組對應的 行(列) 條件下的(dataframe數據)
布爾值的list/可與df對齊的series(布爾類型): 與index長度相同的話 選擇對應值為True的行,與列數相同的話,選取對應值為True 的列。
df的index的子集index2: 選取df中對應的index2的行
函數:輸入為行/列series(外層有逗號)或者dataframe(外層無括號) 返回為對應輸入的一個布爾值表,用來篩選對應的數據。
不同之處:
當對應的行/列標簽為 int類型x時候,iloc表示對應的第x個 index或column,而loc 表示對應的index /column名稱等于這個x。
對應的開閉區間不同 df.loc[1:5,1:5] 會有一個最多 5x5的df數據子集,而df.iloc[1:5,1:5] 會有最多4x4df數據子集,其中iloc的行/列切片不包含最后一個數(與range函數類似)
df = pd.DataFrame([[1, 2,3,14], [4, 5,6,17], [7, 8,9,10],[11,12,13,14]], index=[2,3,4,5], columns=[2,4,5,6]) # loc 行/列條件是對應的標簽值在對應的范圍內,[閉合,閉合] 區間 df.loc[2:5,2:5] # 輸出為: # 2 4 5 #2 1 2 3 #3 4 5 6 #4 7 8 9 #5 11 12 13 # 選取index 為 2 的行里面的值 # 不推薦:df.loc[2] 下文省略 df.loc[2,:] # 輸出為 1,2,3,14 series類型 # 選取index 為 2 的行 保留dataframe類型 df.loc[[2],:] #選取對應列名為 2 的列 df.loc[:,2] # 這里 index 與 列名都是int類型,因此loc方括號中使用int類型,如果是其他類型,對應的數字要改成其他類型的數據,不能再用數字 # iloc 行/列條件是對應的標簽或者列名的索引值在范圍內,[閉合,開放) 區間 df.iloc[2:5,2:5] # 輸出為 # 5 6 #4 9 10 #5 13 14 # 這里 索引是以0開始的,所有行的切片應該寫作 0:5 也可以寫作“ :” # iloc 數字類型來做篩選的 # 不管是loc 還是 iloc 都建議用[行條件,列條件] 來寫,其中如果無需篩選可以用:來占位,表意明確。 # loc 匹配的是 index/列名的值 與對應的條件 # iloc 匹配的是 index/列名對應的索引號 與對應的條件
“Pandas中df.loc[]與df.iloc[]怎么使用”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。