您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關Spark2.4.0有什么功能的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
SparkCore 和 SQL
增加了Barrier ExecutionMode,可以更好的和深度學習的框架整合
同時引入了 30+ 內置函數和 higher-order函數可以處理更復雜的數據類型
改善了與k8s的整合
支持scala 2.12
內置支持了Avro格式數據源,這個感情好,后面浪尖給出測試案例,以后有pb的支持那就更好了。
性能和穩定性
這個優化比較多,值得關注
Connector優化
這個優化主要是Parquet,orc,csv及avro等的優化升級
MLlib
MLlib支持了圖像格式的數據源
StructuredStreaming
使用foreachBatch(支持Python,Scala和Java)將每個微批的輸出行暴露為DataFrame。
為Python API 增加了foreach 和 ForeachWriter
支持使用“kafka.isolation.level”讀取使用事務的生產者生產到kafka topic的已提交消息。
感謝各位的閱讀!關于“Spark2.4.0有什么功能”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。