您好,登錄后才能下訂單哦!
這篇文章主要為大家展示了“Pandas數據存儲的示例分析”,內容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領大家一起研究并學習一下“Pandas數據存儲的示例分析”這篇文章吧。
數據可以有兩種類型-連續的和離散的,這取決于我們的分析要求。有時我們不需要連續變量中的精確值,但需要它所屬的群體。
例如,你的數據中有一個連續變量,年齡。但你需要一個年齡組來進行分析,比如兒童、青少年、成人、老年人。實際上,Binning非常適合解決我們這里的問題。
為了執行Binning,我們使用cut()函數。這對于從連續變量到離散變量非常有用。
import pandas as pd df = pd.read_csv('titanic.csv') from sklearn.utils import shuffle # 隨機化 df = shuffle(df, random_state = 42) df.head() bins = [0,4,17,65,99] labels =['Toddler','Child','Adult','Elderly'] category = pd.cut(df['Age'], bins = bins, labels = labels) df.insert(2, 'Age Group', category) df.head() df['Age Group'].value_counts() df.isnull().sum()
以上是“Pandas數據存儲的示例分析”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。