sklearn中怎么實現數據縮放功能

發布時間：2021-08-09 13:54:38 來源：億速云閱讀：149 作者：Leah 欄目：大數據

今天就跟大家聊聊有關sklearn中怎么實現數據縮放功能，可能很多人都不太了解，為了讓大家更加了解，小編給大家總結了以下內容，希望大家根據這篇文章可以有所收獲。

一、數據縮放

你的預處理數據集中可能包含各種各樣、不同比例的特征字段，比如美元、千克、價格，有的特征列數值范圍在100以內，有的卻達到幾百萬，差異很大。

很多機器學習模型不希望有這樣大的差異，如果數據集各個屬性之間的數值差異越小，則模型表現的會越好。這里不一概而論，具體原因小伙伴們自行探索下。

方法1：數據歸一化

數據歸一化是指將原始數據縮放到0和1之間。

對于依賴于值的大小的模型，這種對輸入屬性的縮放很管用。比如在K近鄰模型的距離測量和回歸系數的準備。

接下來用都知道的鳶尾花數據集演示數據歸一化：

# 對鳶尾花數據集進行數據歸一化處理.
from sklearn.datasets import load_iris
from sklearn import preprocessing
# 加載數據
iris = load_iris()
print(iris.data.shape)
# 分離原始數據集，分為自變量和因變量
X = iris.data
y = iris.target
# 歸一化處理
normalized_X = preprocessing.normalize(X)

方法2：數據標準化

數據標準化是指：將數據縮放，改變每個屬性的分布，使其平均值為0，標準差為1。

諸如高斯過程等依賴于特征分布的模型，對特征進行標準化是非常有用的。

依然用鳶尾花的例子：

# 對鳶尾花數據集進行數據標準化處理.
from sklearn.datasets import load_iris
from sklearn import preprocessing
# 加載數據
iris = load_iris()
print(iris.data.shape)
# 分離原始數據集，分為自變量和因變量
X = iris.data
y = iris.target
# 標準化處理
standardized_X = preprocessing.scale(X)

看完上述內容，你們對sklearn中怎么實現數據縮放功能有進一步的了解嗎？如果還想了解更多知識或者相關內容，請關注億速云行業資訊頻道，感謝大家的支持。

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

sklearn中怎么實現數據縮放功能

方法1：數據歸一化

方法2：數據標準化

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

sklearn中怎么實現數據縮放功能

方法1：數據歸一化

方法2：數據標準化

猜你喜歡

最新資訊

相關推薦

相關標簽