您好,登錄后才能下訂單哦!
隨著互聯網的發展,大數據已經成為了新一代的“網紅”,各行各業幾乎都和大數據產生著關系。Spark是大數據中重要的框架之一,下面為大家分享如何快速入門spark。
Apache Spark是在大數據工業界里用的最多的基于內存的技術框架,尤其是RDD的特性以及應用,對幫助理解Spark和任務提交的流程以及緩存機制。
通過以上教程可以讓大家掌握Spark的環境搭建,任務調度流程,以及RDD代碼的應用。
課程目錄:
第1章 Spark知識講解
01_為什么學習Spark
02_Spark和MapReduce的對比.mp4
03_Spark框架體系
04_Spark下載
05.Spark運行模式介紹
06.Spark集群安裝
07.Spark程序執行流程
08.Spark相關名詞解釋
09_SparkShellLocal
10_SparkShellCluster
11_Spark2.2和Spark1.6Shell對比
第2章 Maven和IDEA
12_Maven和IDEA下載
13_Maven安裝
14_IDEA安裝
15_IDEA中配置Maven
16_Scala環境安裝和IDEA中配置Scala插件
17_IDEA創建Spark工程
18_Spark開發WordCount程序
19_Spark程序打包
20_Spark集群運行打包程序
第3章 RDD知識講解
21_RDD概念
22_RDD執行流程
23_RDD屬性
24_RDD彈性
25_RDD的兩種創建
26_RDD編程API
第4章 Transformation算法
27_Transformation算法
28_Action算法
29_Map
30_filter
31_flatMap
32_sample
33 union
34 intersection
35 distinct
36 join
37_leftOuterJoin
38_rightOuterJoin
39_cartesian
40_groupBy
41_mapPartition
42_mapPartitionWithIndex
43_sortby
44_sortbykey
45_repartition
46_coalesce
47_partitionBy
48_repartitionAndSortWithinPartitions
49_reduce
50_reduceByKey
51_aggregateByKey
52_combineByKey
第5章 Action算法
53_collect
54_count
55_top
56_take
57_takeOrdered
58_first
59_saveAsTextFile
60_foreach
61_其他算子之countByKey
62_其他算子之countByValue
63_其他算子之filterByRange
64_其他算子之flatMapValues
65_其他算子之foreachPartition
66_其他算子之keyBy
67_其他算子之keys和values
68_其他算子之collectAsMap
69_RDD函數傳遞
70_RDD的依賴關系
71_RDD任務劃分
72_Lineage血統
73_RDD緩存(持久化)
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。