91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

基于IDEA使用Spark API開發Spark程序

發布時間:2020-06-13 08:27:22 來源:網絡 閱讀:7425 作者:996440550 欄目:大數據

清明假期折騰了兩天,總結了兩種方式使用IDE進行spark程序,記錄一下:

第一種方法比較簡單,兩種方式都是采用SBT進行編譯的。

注意:本地不需要安裝Scala程序,否則在編譯程序時有版本兼容性問題。


一、基于Non-SBT方式


創建一個Scala IDEA工程

 基于IDEA使用Spark API開發Spark程序

我們使用Non-SBT的方式,點擊“Next”

 基于IDEA使用Spark API開發Spark程序

命名工程,其他按照默認

 基于IDEA使用Spark API開發Spark程序

點擊“Finish”完成工程的創建

 基于IDEA使用Spark API開發Spark程序

修改項目的屬性

 基于IDEA使用Spark API開發Spark程序

首先修改Modules選項

 基于IDEA使用Spark API開發Spark程序

在src下創建兩個文件夾,并把其屬性改為source

 基于IDEA使用Spark API開發Spark程序

下面修改Libraries

 基于IDEA使用Spark API開發Spark程序

將Spark開發需要的jar包導進來

 基于IDEA使用Spark API開發Spark程序

加入后:

 基于IDEA使用Spark API開發Spark程序

導入包完成后,在工程的scala下面創建一個package

 基于IDEA使用Spark API開發Spark程序

創建一個Object對象

 基于IDEA使用Spark API開發Spark程序

構建Spark Driver代碼

 基于IDEA使用Spark API開發Spark程序

該程序是對搜狗日志的處理代碼

接下來進行打包,使用Project Structure的Artifacts

 基于IDEA使用Spark API開發Spark程序

使用From modules with dependencies

 基于IDEA使用Spark API開發Spark程序

 基于IDEA使用Spark API開發Spark程序

選擇Main Class

 基于IDEA使用Spark API開發Spark程序

 基于IDEA使用Spark API開發Spark程序

點擊“OK”

 基于IDEA使用Spark API開發Spark程序

把名稱改為FirstSparkAppJar

 基于IDEA使用Spark API開發Spark程序

因為每臺機器上都安裝了Scala和Spark,所以可以把Scala和Spark相關的jar文件都刪掉

 基于IDEA使用Spark API開發Spark程序

接下來進行Build

 基于IDEA使用Spark API開發Spark程序

選擇“Build Artifacts”

 基于IDEA使用Spark API開發Spark程序

第一次選擇Build,以后同一個工程要選擇Rebuild,然后等待編譯完成

 基于IDEA使用Spark API開發Spark程序

下面使用spark-submit運行程序

 基于IDEA使用Spark API開發Spark程序

最后任務運行完成

 基于IDEA使用Spark API開發Spark程序



二、基于SBT方式


開發工具下載


Spark開發需要以下開發編譯工具:

1、Scala IDE:本文以IntelliJ IDEA為例進行開發,下載地址:

https://www.jetbrains.com/idea/download/

2、SBT(Simple Build Tool)編譯工具下載:

http://www.scala-sbt.org/download.html

下載安裝后,在DOS下執行sbt命令下載其所需要的jar包:

 基于IDEA使用Spark API開發Spark程序

默認jar包(.idea-build、.ivy2、.sbt)下載到C盤用戶目錄下

(注意:使用命令sbt進行下載時要確保網速,最好使用代理下載)


開發工具配置


1、IntelliJ IDEA開發配置:

(1) 下載Scala插件:選擇Configure下的Plugins進入下圖

 基于IDEA使用Spark API開發Spark程序選擇Install JetBrains plugin,搜索Scala進行下載。

(2) 創建基于SBT的Scala工程:

 基于IDEA使用Spark API開發Spark程序

(3) 設置工程名稱以及Scala和SBT版本:

 基于IDEA使用Spark API開發Spark程序注意:

  1. 最好將Download兩個選項取消,否則會覆蓋之前用戶目錄下的SBTjar包,造成編譯不通過等錯誤

  2. SBT和Scala的版本號在C盤用戶目錄下可以看出:

    C:\Users\用戶\.sbt\boot\scala-2.10.4\org.scala-sbt\sbt\0.13.8

    這里可以一次性設置正確,也可以后續修改配置文件(build.sbt修改scala版本,build.properties修改sbt版本)進行修改同步。

  3. 工程路徑不要使用中文,否則即使編譯成功打成jar包也無法執行。


(4) 基于SBT的Scala程序對工程的結構要求比較苛刻,需要建立如下目錄結構:

 基于IDEA使用Spark API開發Spark程序

(5) 添加Spark插件:

 基于IDEA使用Spark API開發Spark程序注意:同時該插件需要添加到lib目錄下(操作系統復制即可)


準備工作完成,下面進行Spark程序開發


編寫代碼

下面以類wordcount程序為例:

編寫Spark程序:

 基于IDEA使用Spark API開發Spark程序

請不要使用InteiiJ IDEA進行編譯(漢字導致后面編譯不過去)


編譯和執行

(1)使用SBT進行編譯和打包:

DOS下進入工程目錄下,使用sbt命令進行編譯和打包:

 基于IDEA使用Spark API開發Spark程序

 基于IDEA使用Spark API開發Spark程序

默認打的jar在工程目錄test\target\scala-2.10下

(2)將jar包上傳到服務器執行:

使用命令:

spark-submit --class test--master yarn test_2.10-0.1-SNAPSHOT.jar 100

更多的參數詳見官方文檔

 基于IDEA使用Spark API開發Spark程序

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

宜兴市| 米泉市| 拜城县| 永济市| 云南省| 邵东县| 临邑县| 小金县| 九寨沟县| 闵行区| 建始县| 新巴尔虎左旗| 乃东县| 沁阳市| 镇雄县| 汤原县| 平昌县| 和田县| 江陵县| 庆阳市| 武强县| 宁津县| 清流县| 灵璧县| 泰和县| 景德镇市| 泌阳县| 淄博市| 习水县| 达日县| 措勤县| 株洲市| 海伦市| 沽源县| 左贡县| 砚山县| 尉氏县| 西乌珠穆沁旗| 屯昌县| 青神县| 龙泉市|