91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python數據預處理常用的技巧有哪些

發布時間:2022-02-11 13:40:49 來源:億速云 閱讀:138 作者:iii 欄目:開發技術

本篇內容介紹了“Python數據預處理常用的技巧有哪些”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!

數據集

這是一個包含臟數據的示例數據框

Python數據預處理常用的技巧有哪些

讓我們看看可以做些什么來使這個數據集變得干凈。

第一列是多余的,應該刪除;

Date 沒有標準;

Name 寫成姓氏、名字,并有大寫和小寫字母;

Payment 代表一個數量,但它們顯示為字符串,需要處理;

在 Note 中,有一些非字母數字應該被刪除;

示例 1

刪除列是使用 drop 函數的簡單操作。除了寫列名外,我們還需要指定軸參數的值,因為 drop 函數用于刪除行和列。 最后,我們可以使用 inplace 參數來保存更改。

import pandas as pd
df.drop("Unnamed: 0", axis=1, inplace=True)

示例 2

我們有多種選擇將日期值轉換為適當的格式。一種更簡單的方法是使用 astype 函數來更改列的數據類型。
它能夠處理范圍廣泛的值并將它們轉換為整潔、標準的日期格式。

df["Date"] = df["Date"].astype("datetime64[ns]")

Python數據預處理常用的技巧有哪些

示例 3

關于名稱列,我們首先需要解決如下問題:

首先我們應該用所有大寫或小寫字母來表示它們。另一種選擇是將它們大寫(即只有首字母是大寫的);

切換姓氏和名字的順序;

df["Name"].str.split(",", expand=True)

Python數據預處理常用的技巧有哪些

然后,我將取第二列與第一列結合起來,中間有一個空格。最后一步是使用 lower 函數將字母轉換為小寫。

df["Name"] = (df["Name"].str.split(",", expand=True)[1] + " " + df["Name"].str.split(",", expand=True)[0]).str.lower()

Python數據預處理常用的技巧有哪些

示例 4

支付Payment的數據類型是不能用于數值分析的。在將其轉換為數字數據類型(即整數或浮點數)之前,我們需要刪除美元符號并將第一行中的逗號替換為點。

我們可以使用 Pandas 在一行代碼中完成所有這些操作

df["Payment"] = df["Payment"].str[1:].str.replace(",", ".").astype("float")

Python數據預處理常用的技巧有哪些

示例 5

Note 列中的一些字符也需要刪除。在處理大型數據集時,可能很難手動替換它們。

我們可以做的是刪除非字母數字字符(例如?、!、-、. 等)。在這種情況下也可以使用 replace 函數,因為它接受正則表達式。

如果我們只想要字母字符,下面是我們如何使用替換函數:

df["Note"].str.replace('[^a-zA-Z]', '')
0      Unhappy
1    Satisfied
2      Neutral
3      Unhappy
4      Neutral
Name: Note, dtype: object

如果我們想要字母和數字(即字母數字),我們需要在我們的正則表達式中添加數字:

df["Note"].str.replace('[^a-zA-Z0-9]', '')
0      Unhappy
1    Satisfied
2      Neutral
3      Unhappy
4      Neutral0
Name: Note, dtype: object

請注意,這次沒有刪除最后一行中的 0,我只需選擇第一個選項。如果我還想在刪除非字母數字字符后將字母轉換為小寫

df["Note"] = df["Note"].str.replace('[^a-zA-Z]', '').str.lower()

Python數據預處理常用的技巧有哪些

與初始形式相比,數據集看起來要好得多。當然,它是一個簡單的數據集,但這些清理操作在處理大型數據集時肯定會對你有所幫助。

“Python數據預處理常用的技巧有哪些”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

重庆市| 万年县| 张北县| 汕尾市| 隆安县| 丹东市| 彩票| 奉节县| 奇台县| 景泰县| 珠海市| 隆尧县| 平果县| 舟曲县| 东阳市| 常宁市| 桓仁| 交城县| 军事| 雷波县| 石棉县| 洛隆县| 宝鸡市| 葵青区| 靖西县| 鄂伦春自治旗| 乌拉特中旗| 巩义市| 肇州县| 馆陶县| 玛纳斯县| 新津县| 江城| 商城县| 罗平县| 民权县| 治多县| 方正县| 三穗县| 邢台县| 龙海市|