win8+python2.7+Eclipse開發spark環境搭建

發布時間：2020-06-24 04:39:23 來源：網絡閱讀：7314 作者：duanpeng198738 欄目：大數據

最近在學習Spark的機器學習，由于在機器學習方面Python語言表現不俗，故我選擇使用Python語言作為Spark機器學習的開發語言，也為后續的深度學習打下基礎，故下面是在windows8.1下搭建eclipse4.4.2+Python2.7.14+Spark2.1.0的開發環境，具體過程如下：

1. 在windows下安裝Python

1.1. 下載Python

到下面這個地址下載對應操作系統的Python安裝文件

https://www.python.org/downloads/release/python-2714/

win8+python2.7+Eclipse開發spark環境搭建

我是windows8.1 64位，故下載Windows x86-64 MSI installer版本的安裝文件。

1.2. 安裝Python

1）、雙擊 win8+python2.7+Eclipse開發spark環境搭建；

2）、在彈出的界面選擇安裝到當前用戶即可，然后點擊Next下一步；

win8+python2.7+Eclipse開發spark環境搭建

3）、選擇安裝的路徑，我這里選擇安裝到D:\Python27\，然后點擊Next下一步；

win8+python2.7+Eclipse開發spark環境搭建

4）、這一步直接點擊Next下一步，然后等待安裝完成；

win8+python2.7+Eclipse開發spark環境搭建

5）、出現如下界面，表示安裝完成，直接點擊Finsh完成。

win8+python2.7+Eclipse開發spark環境搭建

1.3. 環境變量配置

1.3.1. 第一種方式

在環境變量中添加Python目錄：

在命令提示框中(cmd) : 輸入

path=%path%;D:\Python27

按下"Enter"。

注意: D:\Python27 是Python的安裝目錄。

1.3.2. 第二種方式

也可以通過以下方式設置：

· 右鍵點擊"計算機"，然后點擊"屬性"

· 然后點擊"高級系統設置"

· 選擇"系統變量"窗口下面的"Path",雙擊即可！

· 然后在"Path"行，添加python安裝路徑即可(我的D:\Python27)，所以在后面，添加該路徑即可。 ps：記住，路徑直接用分號"；"隔開！

如下圖：

win8+python2.7+Eclipse開發spark環境搭建

· 最后設置成功以后重啟電腦，重啟電腦完成之后在cmd命令行，輸入命令"python"，就可以看到如下圖的相關信息顯示，表示python安裝成功。

win8+python2.7+Eclipse開發spark環境搭建

1.3.3. Python 環境變量

下面幾個重要的環境變量，它應用于Python：

變量名	描述
PYTHONPATH	PYTHONPATH是Python搜索路徑，默認我們import的模塊都會從PYTHONPATH里面尋找。
PYTHONSTARTUP	Python啟動后，先尋找PYTHONSTARTUP環境變量，然后執行此文件中變量指定的執行代碼。
PYTHONCASEOK	加入PYTHONCASEOK的環境變量, 就會使python導入模塊的時候不區分大小寫.
PYTHONHOME	另一種模塊搜索路徑。它通常內嵌于的PYTHONSTARTUP或PYTHONPATH目錄中，使得兩個模塊庫更容易切換。

2. 在windows下安裝Eclipse

該步驟簡單，省略，我的Eclipse版本為4.4.2。

注意：安裝Eclipse之前需要安裝JDK。

3. Eclipse安裝并配置PvDev插件

3.1. 安裝PvDev插件

1）、啟動Eclipse, 點擊Help->InstallNew Software... 在彈出的對話框中，點Add按鈕。 Name中填:pydev, Location中填https://dl.bintray.com/fabioz/pydev/5.2.0（因我的Eclipse為4.4.2故安裝對應5.2.0版本的插件，如果是最新的Eclipse，直接使用http://pydev.org/updates），然后一步一步裝下去。如果裝的過程中，報錯了就重新裝。

win8+python2.7+Eclipse開發spark環境搭建

2）、下面這步只選擇PyDev節點下的所有，然后點擊Next下一步；

win8+python2.7+Eclipse開發spark環境搭建

3）、這一步直接點擊Next下一步；

win8+python2.7+Eclipse開發spark環境搭建

4）、這一步選擇接受Iaccept……，然后點擊Next下一步，然后等待插件安裝完成并重啟Eclipse。

win8+python2.7+Eclipse開發spark環境搭建

3.2. 配置PvDev插件

安裝好pydev后，需要配置Python解釋器。

1）、在Eclipse菜單欄中，點擊Windows->Preferences.

2）、在對話框中，點擊PyDev->Interpreters– Python Interpreter. 點擊New按鈕，選擇python.exe的路徑，然后點擊OK，彈出下一步的窗口；

win8+python2.7+Eclipse開發spark環境搭建

3）、在彈出一個包含很多復選框新的窗口，點OK之后出現下一步的窗口。

win8+python2.7+Eclipse開發spark環境搭建

4）、點擊該窗口的OK則完成插件的配置。

win8+python2.7+Eclipse開發spark環境搭建

4. 開發代碼測試Python環境搭建情況

1）、啟動Eclipse，創建一個新的項目，File->New->Projects...選擇PyDev->PyDevProject 輸入項目名稱，如下圖：

win8+python2.7+Eclipse開發spark環境搭建

2）、新建 PyDevPackage，輸入包名Test1；

win8+python2.7+Eclipse開發spark環境搭建

3）、在__init__.py文件中編寫代碼，然后運行，正常在控制臺輸出，表示開發環境搭建完成。

win8+python2.7+Eclipse開發spark環境搭建

5. 使用Python開發Spark環境配置

5.1. 下載解壓spark安裝包

可以從http://spark.apache.org/downloads.html上下載對應的版本，我用的版本是spark-2.1.0-bin-hadoop2.7.tgz，下載完壓縮文件后，解壓。我解壓到F:\BigData\Spark\spark-2.1.0-bin-hadoop2.7；

5.2. 配置spark環境變量

1）、新建SPARK_HOME變量，變量值為：F:\BigData\Spark\spark-2.1.0-bin-hadoop2.7，同時將%SPARK_HOME%\bin添加到系統Path變量，然后重啟電腦；

win8+python2.7+Eclipse開發spark環境搭建

5.3. Python配置

將spark目錄下的pyspark文件夾（F:\BigData\Spark\spark-2.1.0-bin-hadoop2.7\python\pyspark）復制到python安裝目錄D:\Python27\Lib\site-packages里，然后在cmd命令行窗口執行pyspark命令出現如下圖則表示安裝成功：

win8+python2.7+Eclipse開發spark環境搭建

6. 使用Python開發spark常見問題

6.1. ImportError: No module named py4j.protocol

原因：運行python代碼的時候報如題的錯誤信息，表示Python沒有安裝py4j模塊

解決方案：在cmd命令行下運行cd D:\Python27\Scripts（我的python安裝在D:\Python27\盤，這里是切換到pip的安裝目錄下，然后才能執行pip，沒有裝pip的需要預先安裝），然后運行pipinstall py4j安裝相關庫，如下截圖表示安裝成功。

win8+python2.7+Eclipse開發spark環境搭建

6.2. ImportError: No module named numpy

原因：運行python代碼的時候報如題的錯誤信息，表示Python沒有安裝numpy模塊

解決方案：在cmd命令行下運行cd D:\Python27\Scripts（我的python安裝在D:\Python27\盤，這里是切換到pip的安裝目錄下，然后才能執行pip，沒有裝pip的需要預先安裝），然后運行pipinstall numpy安裝相關庫，如下截圖表示安裝成功。

win8+python2.7+Eclipse開發spark環境搭建

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

win8+python2.7+Eclipse開發spark環境搭建

1. 在windows下安裝Python

1.1. 下載Python

1.2. 安裝Python

1.3. 環境變量配置

1.3.1. 第一種方式

1.3.2. 第二種方式

1.3.3. Python 環境變量

2. 在windows下安裝Eclipse

3. Eclipse安裝并配置PvDev插件

3.1. 安裝PvDev插件

3.2. 配置PvDev插件

4. 開發代碼測試Python環境搭建情況

5. 使用Python開發Spark環境配置

5.1. 下載解壓spark安裝包

5.2. 配置spark環境變量

5.3. Python配置

6. 使用Python開發spark常見問題

6.1. ImportError: No module named py4j.protocol

6.2. ImportError: No module named numpy

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

win8+python2.7+Eclipse開發spark環境搭建

1. 在windows下安裝Python

1.1. 下載Python

1.2. 安裝Python

1.3. 環境變量配置

1.3.1. 第一種方式

1.3.2. 第二種方式

1.3.3. Python 環境變量

2. 在windows下安裝Eclipse

3. Eclipse安裝并配置PvDev插件

3.1. 安裝PvDev插件

3.2. 配置PvDev插件

4. 開發代碼測試Python環境搭建情況

5. 使用Python開發Spark環境配置

5.1. 下載解壓spark安裝包

5.2. 配置spark環境變量

5.3. Python配置

6. 使用Python開發spark常見問題

6.1. ImportError: No module named py4j.protocol

6.2. ImportError: No module named numpy

猜你喜歡

最新資訊

相關推薦

相關標簽