1. 程式人生 > >使用PyCharm配置Spark的Python開發環境(基礎)

使用PyCharm配置Spark的Python開發環境(基礎)

在本地搭建好Spark 1.6.0後,除了使用spark-submit提交Python程式外,我們可以使用PyCharm這個IDE在本地進行開發除錯,提升我們的開發效率。配置過程也十分簡單,在stackoverflow上搜索到的。同時,IntelliJ IDEA加入Python外掛後也可以使用Python開發Spark程式,配置步驟一致。

0.安裝PyCharm和py4j

我的系統環境(Ubuntu 14.04.4 LTS)

安裝步驟: - Unpack the pycharm-5.0.4.tar.gz using the following command: tar xfz pycharm-5.0.4.tar.gz - Run pycharm.sh from the bin subdirectory

安裝py4j:

$ sudo pip install py4j
1.配置Pycharm

開啟PyCharm,建立一個Project。 然後選擇“Run” ->“Edit Configurations” ->“Environment variables” 增加SPARK_HOME目錄與PYTHONPATH目錄。 - SPARK_HOME:Spark安裝目錄 - PYTHONPATH:Spark安裝目錄下的Python目錄
2.測試Pycharm

執行一個小的Spark程式看看:

“”“SimpleApp”“”

from pyspark import SparkContext

logFile = “/home/tom/spark-1.6.0/README.md”
sc = SparkContext(“local”,”Simple App”)
logData = sc.textFile(logFile).cache()

numAs = logData.filter(lambda s: ‘a’ in s).count()
numBs = logData.filter(lambda s: ‘b’ in s).count()

print(“Lines with a: %i, lines with b: %i”%(numAs, numBs))
執行結果:

Lines with a: 58, lines with b: 26

相關推薦

使用PyCharm配置Spark的Python開發環境基礎

在本地搭建好Spark 1.6.0後,除了使用spark-submit提交Python程式外,我們可以使用PyCharm這個IDE在本地進行開發除錯,提升我們的開發效率。配置過程也十分簡單,在stackoverflow上搜索到的。同時,IntelliJ IDEA

NotePad++配置python開發環境windows

python代碼 當前 ctr sharp gpo 菜單 一行 post 執行 一、安裝python插件 1.插件->Plugin Manager->Show Plugin Manager, Available標簽頁, 2.搜索python,任意下載一個pyth

ubuntu18.04.1下配置前端開發環境nvm,nvm安裝不成功的解決辦法

# Proxy alias setproxy="export ALL_PROXY=socks5://60.205.84.96:10086" alias unsetproxy="unset ALL_PROXY" 寫到 ~/.bashrc 最後面 然後,退出當前的 terminator 再開

在Linux系統配置PHP開發環境CentOS

一、使用FileZilla將虛擬機器的伺服器連線起來1、ifconfig獲取虛擬機器的IP地址2、在FileZilla輸入各項資訊進行連線    注:①使用管理員的賬號進行連線   如此才能訪問到根目錄。           ②埠號:大部分都是預設不輸入,我的偏偏要輸入22才

windows環境下搭建Java開發環境:jdk安裝和配置

變量 win jns jdk安裝 分享 tool 直接 www. 技術 一、資源下載   官網:http://www.oracle.com/technetwork/java/javase/downloads/index.html   本人安裝的是jdk1.8,百度雲資源:鏈

ubntu下單機配置fastdfs作為開發環境4---將 fastdfs客戶端整合到現有java專案中

前言 話說,起初還覺得fastdfs的配置及整合會很簡單。。結果不是的。單單篇幅已經有四篇文章了。 正題: 請參考: 關於FastDFS蛋疼的叢集和負載均衡(九)之建立FastDFS的Maven專案 這一系列文章有意思。 FastDFS java client SDK

ubntu下單機配置fastdfs作為開發環境3--- nginx如何啟用fastdfs擴充套件以及相關配置

前言 參考: FastDFS+Nginx(單點部署)事例 FastDFS搭建單機圖片伺服器(二) 配置過程簡介 1.配置mod-fastdfs.conf,並拷貝到/etc/fdfs檔案目錄下。 建立nginx存放日誌和資料的目錄 mkdir /home/fastdfs

ubntu下單機配置fastdfs作為開發環境2---nginx生產環境下再編譯+fastdfs擴充套件模組的編譯

前言 參考文章 FastDFS搭建單機圖片伺服器(二) 這篇文章也是參考了網上的文章,為什麼不直接說是轉載的?因為上面文章只說了一半—實際生產環境,譬如,nginx除了fastdfs,實際上可能還要編譯openssl,geoip等等擴充套件模組的。 編譯安裝過程 1、安裝

Flutter開發環境Window配置及踩坑記錄

[email protected] MINGW64 /e/zengfp/flutter/myapp$ flutter runLaunching lib/main.dart on GIONEE O8 in debug mode...Initializing gradle...

Windows10下配置大資料開發環境1

一 準備工作 如果安裝的Hadoop是3.1.1版本,應選擇jdk1.8以上版本 3. 搜尋HADOOP在Windows環境需要的工具 二 安裝JDK 安裝JDK後,需要配置JDK的環境,這裡可以自行百度。 三 安裝和配置Hapood環境

Python基礎:搭建開發環境1

1.Python語言簡介   2.Python環境   Python環境產品存在多個。 2.1 CPython   CPython是Python官方提供的。一般情況下提到的Python就是指CPython,CPython是基於C語言編寫的。   CPython實現的直譯器將原始碼編譯為位

SublimeText配置Python開發環境互動、快捷開啟 REPL、自動補全,側邊欄等

SublimeText配置Python開發環境(互動、快捷開啟 REPL、自動補全等) 0.效果圖: 主題是:Blackboard 1. 基礎配置、包安裝等基礎操作參考:sublime tex

Qt for Linux:樹莓派3配置Qt開發環境Qt 5.9.1 和 OpenCV 2.4.13

關於樹莓派 我用的是 樹莓派樹莓派3代B型 Raspberry Pi Model 3 B 我拿來是做監控視訊採集的,所以會用到 Qt 和 OpenCV 開發上,除了視訊採集和視訊檔案生成用的OpenCV,其他全部Qt 本篇文章只涉及樹莓派的配置,不涉及具

看圖配置D語言整合開發環境IDE,使用Poseidon

D語言是個具有很多高階特性的編譯型的語言,這篇文章教大家配置一個整合程式設計環境。write by DKink|棼紫 進這個站點http://www.digitalmars.com/找到DownLoads下的Download Digital Mars D compiler點選

使用Visual Studio一勞永逸式配置OpenGL開發環境GLFW3+GLAD

引子 OpenGL版本眾多,需要引入額外的第三方庫才能很好的滿足我們平時渲染的需求,對於剛開始學習的同學們比較麻煩。 我也多次遇到很多落後的配置教程,浪費了時間不說,也會自己技術和現代OpenGL的技術脫節。 在當前的時間點(2018年),學習OpenGL

ubuntu下配置python開發環境Eclipese+Pydev

大家都知道,ubuntu中自帶了python,不用安裝,直接就可以在編寫執行python。個人覺得這是ubuntu最大的優點之一,windows什麼都要再裝,而且還那麼大。。。 當然,工欲善其事,必先利其器。現在很少有人寫程式不用IDE了,寫python固然也有一些獨立的ID

Linux(ubuntu)下Pycharm配置python執行環境編譯器中匯入虛擬環境

Pycharm配置python的執行環境(Linux(ubuntu)、Windows) 前言 前段時間跑python程式碼,一直在編輯器中寫,命令列中呼叫執行。如果寫一些小程式還可以,但如果要搭建神經網路,用到tensorflow或theano這些深度框

Windows安裝Python環境和Python集成開發環境IDEPyCharm

分享 進入 官網 python3.5 鏈接 nload 單機 1025. win 1.Windows中安裝Python 3 (1)打開瀏覽器,訪問Python官網(https://www.python.org/) (2)光標移動至Downloads,單機Windows鏈接

在python開發工具PyCharm中搭建QtPy環境詳細

在python開發工具PyCharm中搭建QtPy環境(詳細)        在Python的開發工具PyCharm中安裝QtPy5(版本5):開啟“File”——“Settings”——“Project Interpreter”,點選視窗中右側點新增按鈕,然後在彈出的

完美搭建Cocos2d-JS開發環境

npm ip) 當前 ref ram nis 更多 fin 點擊 使用Cocos2d-JS引擎開發遊戲。基本的程序代碼是JavaScript語言,因此,凡是能夠開發JavaScript語言工具都適用於Cocos2d-JS遊戲開發。本書我們推薦WebStorm和Cocos C