91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Spark 數據導入時的類型檢測相關問題

發布時間:2020-08-04 19:57:26 來源:網絡 閱讀:801 作者:去買大白兔 欄目:大數據

Spark 可以讀取文本,csv和rmdb中的數據,并且帶有類型自動檢測功能


public final static String DATA_SEPARATOR_TAB = "\t";

session.read().format("csv").option("delimiter", Constants.DATA_SEPARATOR_TAB).option("inferSchema", "true").option("header", "true").option("encoding", charset).csv(path).toDF(columnNames).write().mode(mode).saveAsTable(tempTable);


紅色屬性決定spark是否自動探測數據類型,如果不開啟自動探測,默認都是string

rdbms導入到spark中默認會類型探測和對應,但是在處理sqlserver的時間類型有問題

Spark 數據導入時的類型檢測相關問題



如上圖所示

只有datetime可以被spark識別并存儲為日期類型,其他的都落地成了String類型,所以在執行data_formate時因為要多做一步轉換所以性能會差很多




向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

广宗县| 三门峡市| 科技| 新昌县| 福州市| 奉化市| 根河市| 新密市| 清涧县| 阿拉善左旗| 广南县| 玛纳斯县| 道孚县| 翁牛特旗| 资源县| 文成县| 东平县| 嘉禾县| 寿宁县| 南康市| 乌鲁木齐市| 安达市| 大港区| 盖州市| 德格县| 兴隆县| 祥云县| 阿鲁科尔沁旗| 镇沅| 铜鼓县| 泸水县| 河西区| 石城县| 六枝特区| 海门市| 灵宝市| 杂多县| 石楼县| 晋州市| 灌云县| 廊坊市|