91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

spark寫orc格式文件

發布時間:2020-07-24 12:11:01 來源:網絡 閱讀:8216 作者:xiaobin0303 欄目:大數據
  1. 在hive中建表格式存儲格式為orc

      create table user(id int,name string) stored as orc;  

  2. spark寫文件        

    val jsons = "hdfs://localhost:9000/test/artist_orc.json"
    val people = sc.textFile(jsons)
    val schemaString = "id name"
    val schema = StructType(schemaString.split(" ").map(fieldName => {if(fieldName == "name")
      StructField(fieldName, StringType, true) else StructField(fieldName, IntegerType, true)}))

    val rowRDD = people.map(line=>{
      JSONObject.fromObject(line)
    }).map(p => Row(new Integer(p.get("id").toString), p.get("name")))

    val hiveContext = new org.apache.spark.sql.hive.HiveContext(sc)
    val peopleSchemaRDD = hiveContext.createDataFrame(rowRDD, schema)
    peopleSchemaRDD.write.format("orc").save("hdfs://localhost:9000/user/xb/warehouse/artist_orc/adf")


向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

会理县| 安塞县| 沁阳市| 浦北县| 岳阳县| 红安县| 鄂伦春自治旗| 白山市| 江口县| 上蔡县| 宣武区| 绥阳县| 股票| 象州县| 聂拉木县| 通化市| 荆州市| 望谟县| 扎囊县| 山丹县| 额济纳旗| 南丰县| 兰溪市| 靖安县| 大安市| 隆化县| 通海县| 黄陵县| 平舆县| 泗洪县| 庄浪县| 梓潼县| 塔河县| 图木舒克市| 绿春县| 德庆县| 禄劝| 谷城县| 且末县| 将乐县| 宁武县|