Spark程序本地運行

阿新 • • 發佈：2017-05-29

統計 sca 解壓 zip textfile oop lec per sparkconf

本次安裝是在JDK安裝完成的基礎上進行的！ SPARK版本和hadoop版本必須對應！！！

spark是基於hadoop運算的，兩者有依賴關系，見下圖：

前言：

1.環境變量配置：

1.1 打開“控制面板”選項

技術分享

1.2.找到“系統”選項卡

技術分享

1.3.點擊“高級系統設置”

技術分享

1.4.點擊“環境變量”

技術分享

2.新建和編輯環境變量

技術分享

1.下載hadoop-2.6.0.tar.gz文件，並解壓在本地

1.1 新建環境變量上配置

HADOOP_HOME
D:\JAVA\hadoop

技術分享

1.2 修改PATH路徑

$HADOOP_HOME/bin;

技術分享

2.下載scala-2.10.6.zip文件，並解壓在本地

2.1 新建環境變量上配置

SCALA_HOME
D:\JAVA\scala

技術分享

2.2 修改PATH路徑

%SCALA_HOME%\bin;%SCALA_HOME%\jre\bin;

技術分享

3.下載spark-1.6.2-bin-hadoop2.6.tgz文件，並解壓在本地

3.1 新建環境變量上配置

SPARK_HOME

D:\JAVA\spark_home\bin

技術分享

3.2 修改PATH路徑

PATH

$SPARK_HOME/bin;

技術分享

4.下載scala-IDE.zip文件，並解壓在本地

新建一個工程，修改library：

技術分享

Scala library一定要是：2.10.X

新建一個自己的library：添加一個Jar文件（${spark_home}/lib）

技術分享

下跟Word Count代碼

package com

import org.apache.spark.SparkConf
import org.apache.spark.api.java.JavaSparkContext
import org.apache.spark.SparkContext

/**
 * 統計字符出現次數
 */
object WordCount {
  def main(args: Array[String]): Unit = {
         
         System.setProperty( 
"hadoop.home.dir", "D:\\JAVA\\hadoop");
         val sc = new SparkContext("local", "My App")  
         val line = sc.textFile("/srv/1.txt")
     
         line.map((_, 1)).reduceByKey(_+_).collect().foreach(println)
     
         sc.stop()
    println(111111)
  }
}

Word Count

hadoop下載點擊這裏

spark下載點擊這裏

scala安裝包，scala IDE下載點擊這裏

Spark程序本地運行

統計 sca 解壓 zip textfile oop lec per sparkconf 本次安裝是在JDK安裝完成的基礎上進行的！ SPARK版本和hadoop版本必須對應！！！ spark是基於hadoop運算的，兩者有依賴關系，見下圖：前言： 1.環境變量配置：

window本地運行mapreduce程序

方便 set con 直接系統 ip地址運行程序運行時 tps mapreduce的運行方式一般有兩種，一是從本地導出一個jar包，在傳到虛擬機上運行，這樣調試起來非常的不方便，如果出現錯誤就需要重新導出jar包。第二種方式是在本地直接運行，但是在運行前需要

spark的運行模式之 ==> 本地運行模式

出了 2.7 配置 user 默認 pro 上傳讀取修改 spark目前有四種運行模式：本地運行、在yarn上運行、standalone、mesos。所謂運行模式，就是指spark應用跑在什麽地方。mr程序可以在本地運行，也可以提交給yarn運行。這個概念是一樣的。

通過編寫c語言程序，運行時實現打印另一個程序的源代碼和行號

clas 行號意義 spa clu 可執行 stdlib.h 讀取進行 2017年6月1日程序編寫說明： 1.實現行號的打印，實現代碼的讀取和輸出，理解主函數中的參數含義。 2.對fgets函數理解不夠 3.對return(1); return 0的含義理解不夠 4.未

Hexo 搭建博客本地運行常見報錯及解決辦法

render error: 錯誤 exp 手動配置 fig.yml 文件中 size server 作為一名在hexo方面的新手，我在使用hexo編輯文檔時遇到了很多問題，hexo generate編譯的時候遇到了各種錯誤。在此將這些錯誤及其解決方案記錄下來，以便日後查證

storm單詞計數本地運行

cep cal txt wordcount ioe ktr ren pos 分割 import java.io.File; import java.io.IOException; import java.util.Collection; import java.u

設置程序開機運行並添加快捷方式

except cati span cut erro tex 顯示信息 value //判斷程序是否在運行，如果未運行就啟動該程序 Timer timer = new Timer(); protected override void OnS

spark學習(基礎篇)--(第三節)Spark幾種運行模式

一些記錄 image ica runner 1.3 函數 ive 啟動 driver h2 { color: #fff; background-color: #7CCD7C; padding: 3px; margin: 10px 0px } h3 { color: #fff

[經驗分享] windows2008服務器設置系統啟動時程序自動運行

edit 行程添加腳本文件 nor ont html bsp idt 轉自：http://bbs.qcloud.com/thread-4082-1-1.html 設置windows服務器啟動時自動運行程序，而且不需要用戶登錄，就可以啟動首先準備好，程序的啟動腳本文

系統下程序的運行機制

hex wix svd ahp ef7 aml ongl .com dcl monoforandroid%E8%AF%95%E7%94%A8%E4%BD%93%E9%AA%8C ?????? http://music.baidu.com/songlist/4960439

微信小程序-----安裝，編寫第一個小程序和運行到手機端

alt ima 下載 weixin nload 公眾平臺軟件分享微信公眾平臺第一步：微信公眾平臺註冊賬號，並選擇小程序，網址：mp.weixin.qq.com 填寫相關信息，如:主體類型（個人或者企業）　　 AppID 在開發中都是用的到的，

spark 卡在spark context，運行出現spark Exception encountered while connecting to the server : javax.security.sasl.SaslException

stand exc val user red class 運行 password spa 原因：使用root用戶運行spark代碼解決方法：使用非管理員賬戶運行spark即可 [[email protected] bin]$ ./add-user.sh

要求根據RandomStr.java：使用類型轉換生成六位驗證字符串，示例程序每次運行時，都會生成不同的字符串。

str ima method edi 驗證碼不同的 [] 類型直接 1.程序設計思想驗證碼 ①定義一個字符串變量來保存隨機生成的。 ②利用循環產生六位隨機數，在產生每一位時將其轉換為char類型並寫在字符串後面。 ③利用對話框顯示生成的驗證碼，並提示用戶輸入驗證碼。 ④

windows下9款一鍵快速搭建PHP本地運行環境的好工具(含php7.0環境)

home sns web服務 sof web zend 服務 mysql php 推薦幾款一鍵快速搭建PHP本地運行環境的好工具(含php7.0及apache，nigix，mysql) 首推phpstudy2016和wampServer3.0.6 理由支持php7.

Java本地運行中文正常，部署到Weblogic中文亂碼

enc 找到 c中當前 encoding 配置例如 odi options 1.找到weblogic安裝目錄,當前項目配置的domain 2.找到bin下的setDomainEnv.cmd文件 3.打開文件,從文件搜索最後一個set JAVA_OPTIONS=%JAVA

【Python】程序在運行失敗時，一聲不吭繼續運行pass

pass語句 found col con top path count nts 一聲在前面程序出現異常時，我們都會給一個提示，告訴用戶，程序為什麽會異常，但是現在我們想在程序出現異常時，不做處理，讓程序默默的往下執行，不要做聲。那麽我們就引入了pass語句 def co

通過pl/sql計算程序的運行時間

get mod tar ger this int || auth var 在sqlplus中運行sql語句或者pl/sql的時候如果需要統計運行的時間，只需要開啟set timing on選項即可。 SQL> set timing onSQL>SQL> s

如何利用 JConsole觀察分析Java程序的運行，進行排錯調優

hotspot 字符 env 如果 pin ber -c 相對 docs 一、JConsole是什麽從Java 5開始引入了 JConsole。JConsole 是一個內置 Java 性能分析器，可以從命令行或在 GUI shell 中運行。您可以輕松地使用 J

Java基礎8-淺談java程序的運行機制與JVM運行

style 窗口 exe 了解體感語法我們 nbsp .exe 一、java程序的運行機制 Java開發的整個生命周期，可以概括為兩個階段：編譯階段和運行階段。 1.編譯階段 ①程序員編寫一個符合java語法的xx.java的源文件。 ②使用javac.exe命令對以

在IntelliJ IDEA中配置Spark(Java API)運行環境

appname java api ont lib with dep ava cat net 1. 新建Maven項目初始Maven項目完成後，初始的配置（pom.xml）如下： 2. 配置Maven 向項目裏新建Spark Core庫 <?xml versi

Spark程序本地運行

本次安裝是在JDK安裝完成的基礎上進行的！ SPARK版本和hadoop版本必須對應！！！

1.環境變量配置：

2.新建和編輯環境變量

1.下載hadoop-2.6.0.tar.gz文件，並解壓在本地

2.下載scala-2.10.6.zip文件，並解壓在本地

3.下載spark-1.6.2-bin-hadoop2.6.tgz文件，並解壓在本地

4.下載scala-IDE.zip文件，並解壓在本地

相關推薦