91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

Pandas數據離散化的示例分析

發布時間：2021-09-03 10:29:54 來源：億速云閱讀：143 作者：小新欄目：開發技術

這篇文章主要為大家展示了“Pandas數據離散化的示例分析”，內容簡而易懂，條理清晰，希望能夠幫助大家解決疑惑，下面讓小編帶領大家一起研究并學習一下“Pandas數據離散化的示例分析”這篇文章吧。

為什么要離散化

連續屬性離散化的目的是為了簡化數據結構，數據離散化技術可以用來減少給定連續屬性值的個數。離散化方法經常作為數據挖掘的工具
扔掉一些信息,可以讓模型更健壯,泛化能力更強

什么是數據的離散化

連續屬性的離散化就是在連續屬性的值域上，將值域劃分為若干個離散的區間，最后用不同的符號或整數值代表落在每個子區間中的屬性值

分箱

Pandas數據離散化的示例分析

案例

1.先讀取股票的數據，篩選出p_change數據

data = pd.read_csv("./data/stock_day.csv")
p_change= data['p_change']

2.將股票漲跌幅數據進行分組

使用的工具：

pd.qcut(data, bins)——等深分箱：

對數據進行分組將數據分組一般會與value_counts搭配使用，統計每組的個數

series.value_counts()：統計分組次數

# 自行分組
qcut = pd.qcut(p_change, 10)
# 計算分到每個組數據個數
qcut.value_counts()

自定義區間分組：

pd.cut(data, bins)——等寬分箱：

bins是整數—等寬
bins是列表--自定義分箱

# 自己指定分組區間
bins = [-100, -7, -5, -3, 0, 3, 5, 7, 100]
p_counts = pd.cut(p_change, bins)

Pandas數據離散化的示例分析

以上是“Pandas數據離散化的示例分析”這篇文章的所有內容，感謝各位的閱讀！相信大家都有了一定的了解，希望分享的內容對大家有所幫助，如果還想學習更多知識，歡迎關注億速云行業資訊頻道！

向AI問一下細節

推薦閱讀：

免責聲明：本站發布的內容（圖片、視頻和文字）以原創、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
springcloud注冊hostname或者ip的示例分析
下一篇新聞：
MySQL中的隱藏列的具體查看方法

猜你喜歡

AI
助
手

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

新昌县| 万安县| 仁布县| 马龙县| 雅安市| 仁化县| 获嘉县| 岢岚县| 吉木萨尔县| 长沙县| 鞍山市| 石河子市| 福州市| 钦州市| 宁化县| 雷波县| 垦利县| 大理市| 大庆市| 浠水县| 大新县| 周口市| 六盘水市| 托克托县| 泸州市| 泉州市| 墨玉县| 宁晋县| 宿州市| 合水县| 孝感市| 浮山县| 都匀市| 兴城市| 江津市| 徐水县| 东安县| 昂仁县| 哈尔滨市| 海口市| 青海省|