91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Pandas數據離散化的示例分析

發布時間:2021-09-03 10:29:54 來源:億速云 閱讀:143 作者:小新 欄目:開發技術

這篇文章主要為大家展示了“Pandas數據離散化的示例分析”,內容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領大家一起研究并學習一下“Pandas數據離散化的示例分析”這篇文章吧。

為什么要離散化

  • 連續屬性離散化的目的是為了簡化數據結構,數據離散化技術可以用來減少給定連續屬性值的個數。離散化方法經常作為數據挖掘的工具

  • 扔掉一些信息,可以讓模型更健壯,泛化能力更強

什么是數據的離散化

連續屬性的離散化就是在連續屬性的值域上,將值域劃分為若干個離散的區間,最后用不同的符號或整數 值代表落在每個子區間中的屬性值

分箱

Pandas數據離散化的示例分析

案例

1.先讀取股票的數據,篩選出p_change數據

data = pd.read_csv("./data/stock_day.csv")
p_change= data['p_change']

2.將股票漲跌幅數據進行分組

使用的工具:

  • pd.qcut(data, bins)——等深分箱:

    • 對數據進行分組將數據分組 一般會與value_counts搭配使用,統計每組的個數

  • series.value_counts():統計分組次數

# 自行分組
qcut = pd.qcut(p_change, 10)
# 計算分到每個組數據個數
qcut.value_counts()

自定義區間分組:

  • pd.cut(data, bins)——等寬分箱:

    • bins是整數—等寬

    • bins是列表--自定義分箱

# 自己指定分組區間
bins = [-100, -7, -5, -3, 0, 3, 5, 7, 100]
p_counts = pd.cut(p_change, bins)

Pandas數據離散化的示例分析

以上是“Pandas數據離散化的示例分析”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

新昌县| 万安县| 仁布县| 马龙县| 雅安市| 仁化县| 获嘉县| 岢岚县| 吉木萨尔县| 长沙县| 鞍山市| 石河子市| 福州市| 钦州市| 宁化县| 雷波县| 垦利县| 大理市| 大庆市| 浠水县| 大新县| 周口市| 六盘水市| 托克托县| 泸州市| 泉州市| 墨玉县| 宁晋县| 宿州市| 合水县| 孝感市| 浮山县| 都匀市| 兴城市| 江津市| 徐水县| 东安县| 昂仁县| 哈尔滨市| 海口市| 青海省|