91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

spark mllib如何實現基于卡方校驗的特征選擇

發布時間:2021-12-16 14:42:12 來源:億速云 閱讀:134 作者:小新 欄目:云計算

這篇文章給大家分享的是有關spark mllib如何實現基于卡方校驗的特征選擇的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。

運行代碼如下

package spark.FeatureExtractionAndTransformation

import org.apache.spark.mllib.feature.ChiSqSelector
import org.apache.spark.mllib.linalg.Vectors
import org.apache.spark.mllib.regression.LabeledPoint
import org.apache.spark.mllib.util.MLUtils
import org.apache.spark.{SparkConf, SparkContext}

/**
  * 基于卡方校驗的特征選擇
  * 卡方校驗:
  * 在分類資料統計推斷中一般用于檢驗一個樣本是否符合預期的一個分布.
  * 是統計樣本的實際值與理論推斷值之間的偏離程度.
  * 卡方值越小,越趨于符合
  *
  * Created by eric on 16-7-24.
  */
object FeatureSelection {
  val conf = new SparkConf()                                     //創建環境變量
    .setMaster("local")                                             //設置本地化處理
    .setAppName("TF_IDF")                              //設定名稱
  val sc = new SparkContext(conf)

  def main(args: Array[String]) {
    val data = MLUtils.loadLibSVMFile(sc, "/home/eric/IdeaProjects/wordCount/src/main/spark/FeatureExtractionAndTransformation/fs.txt")
    val discretizedData = data.map { lp => //創建數據處理空間
      LabeledPoint(lp.label, Vectors.dense(lp.features.toArray.map {x => x/2}))
    }

    val selector = new ChiSqSelector(2)//創建選擇2個特性的卡方校驗
    val transformer = selector.fit(discretizedData)//創建訓練模型

    val filteredData = discretizedData.map { lp =>  //過濾前兩個特性
      LabeledPoint(lp.label, transformer.transform(lp.features))
    }
    filteredData.foreach(println)

//    (0.0,[1.0,0.5])
//    (1.0,[0.0,0.0])
//    (0.0,[1.5,1.5])
//    (1.0,[0.5,0.0])
//    (1.0,[2.0,1.0])
  }
}

fs.txt

0 1:2 2:1 3:0 4:1
1 1:0 2:0 3:1 4:0
0 1:3 2:3 3:2 4:2
1 1:1 2:0 3:4 4:3
1 1:4 2:2 3:3 4:1

結果如下

spark mllib如何實現基于卡方校驗的特征選擇

感謝各位的閱讀!關于“spark mllib如何實現基于卡方校驗的特征選擇”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

永泰县| 平度市| 临城县| 阳东县| 广饶县| 郑州市| 大港区| 贡觉县| 丰城市| 嘉义县| 宜都市| 江阴市| 衡东县| 八宿县| 武安市| 沛县| 枞阳县| 克拉玛依市| 怀安县| 舞阳县| 大足县| 高陵县| 准格尔旗| 那曲县| 伽师县| 盐津县| 西畴县| 福清市| 定襄县| 乌恰县| 汉川市| 大洼县| 蒙自县| 伊金霍洛旗| 新绛县| 兴义市| 驻马店市| 涿鹿县| 垦利县| 延边| 建湖县|