Scala +Spark+Hadoop+Zookeeper+IDEA實現WordCount單詞計數（簡單例項）

阿新 • • 發佈：2018-12-21

IDEA+Scala +Spark實現wordCount單詞計數

一、新建一個Scala的object單例物件，修改pom檔案

（1）下面文章可以幫助參考安裝 IDEA 和新建一個Scala程式。

（2）pom檔案

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>com.mcb.scala02</groupId>
    <artifactId>scala02</artifactId>
    <version>1.0-SNAPSHOT</version>

    <properties>
        <maven.compiler.source>1.8</maven.compiler.source>
        <maven.compiler.target>1.8</maven.compiler.target>
        <encoding>UTF-8</encoding>
        <scala.version>2.10.5</scala.version>
        <spark.version>1.6.3</spark.version>
        <hadoop.version>2.7.5</hadoop.version>
    </properties>
    <dependencies>
        <dependency>
            <groupId>org.scala-lang</groupId>
            <artifactId>scala-library</artifactId>
            <version>${scala.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-core_2.10</artifactId>
            <version>${spark.version}</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-client</artifactId>
            <version>${hadoop.version}</version>
        </dependency>
    </dependencies>


</project>

二、Scala 程式碼

package day05

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

import scala.collection.mutable

object SparkWordCount {

  def main(args: Array[String]): Unit = {
    //配置資訊類
    //1，setAppName(任務名稱) setMaster(表示開啟多少個執行緒執行)
    val conf: SparkConf = new SparkConf().setAppName("SparkWordCount").setMaster("local[*]")

    //上下文物件
    val sc: SparkContext = new SparkContext(conf)

    //讀取資料(資料通過陣列 args進入)
    val lines: RDD[String] = sc.textFile(args(0))

    //處理資料
    val map01: RDD[(String, Int)] = lines.flatMap(_.split(" ")).map((_,1))
    val wordCount: RDD[(String, Int)] = map01.reduceByKey(_+_).sortBy(_._2,false)

    val wcToBuffer: mutable.Buffer[(String, Int)] = wordCount.collect().toBuffer
    println(wcToBuffer)

    sc.stop()
  }
}

三、在伺服器上面啟動Hadoop的hdfs和spark（我這兒啟動的hdfs的高可用）

文章連結點選：

3.1 檢視Jps（三臺，其中centos01 為namenode，centos02是namenode，MyLinux是datanode）

3.2 web ui看一下hdfs 內部檔案

（1）web ui 顯示圖

（2）檢視檔案內容（三個檔案均問以空格分割的單詞。）

3.3 IDEA 配置（傳參args）

（1）點選右上角Edit Configurations

（2）新增application，名稱叫做SparkWordCount

3.4 執行結果（讀取並執行成功）~~~

完美~~

歡迎訂閱關注公眾號（JAVA和人工智慧）

獲取更多免費書籍、資源、視訊資料

文章超級連結：

Scala +Spark+Hadoop+Zookeeper+IDEA實現WordCount單詞計數（簡單例項）

IDEA+Scala +Spark實現wordCount單詞計數一、新建一個Scala的object單例物件，修改pom檔案（1）下面文章可以幫助參考安裝 IDEA 和新建一個Scala程式。（2）pom檔案 <?xml

Scala+Spark+Hadoop+IDEA實現WordCount單詞計數，上傳並執行任務（簡單例項-下）

Scala+Spark+Hadoop+IDEA上傳並執行任務本文接續上一篇文章，已經在IDEA中執行Spark任務執行完畢，測試成功。一、打包 1.1 將setMaster註釋掉 package day05 import

Spring整合Hibernate實現Spring Data JPA （簡單使用）

pda artifact framework factor path sta ans 項目結構 pub 直接上代碼： pom.xml  <!-- spring data jp

NodeJs 實現 WebSocket 即時通訊（簡單版）

服務端程式碼 var ws = require("nodejs-websocket"); console.log("開始建立連線...") var game1 = null,game2 = null , game1Ready = false , game2Read

SpringMVC+jade實現高效能模板引擎（簡單配置）

最近在研究一個前後端通用的高效能模板引擎，大概搜尋了下資料，有很多類似的模板引擎，比如Jade，Mustache.js，Dust.js，Nunjucks，EJS等等，當然只適用於前端或者只適用於後端的模板引擎就不算啦，比如（jquery template，fre

Hadoop WordCount單詞計數原理

clas oop 圖片 tput 進行打包 red div src 計算文件中出現每個單詞的頻數輸入結果按照字母順序進行排序編寫WordCount.java 包含Mapper類和Reducer類編譯WordCount.java javac -classp

Hadoop之MapReduce過程，單詞計數WordCount

單詞計數是最簡單也是最能體現MapReduce思想的程式之一，可以稱為MapReduce版“Hello World”，該程式的完整程式碼可以在Hadoop安裝包的src/example目錄下找到。單詞計數主要完成的功能：統計一系列文字檔案中每個單詞出現的次數，如下圖所示。 WordCo

Spark之路：（一）Scala + Spark + Hadoop環境搭建

一、Spark 介紹 Spark是基於記憶體計算的大資料分散式計算框架。Spark基於記憶體計算，提高了在大資料環境下資料處理的實時性，同時保證了高容錯性和高可伸縮性，允許使用者將Spark部署在大量廉價硬體之上，形成叢集。 1.提供分散式計算功能，將分散式

hadoop入門（六）JavaAPI+Mapreduce例項wordCount單詞計數詳解

剛剛研究了一下haoop官網單詞計數的例子，把詳細步驟解析貼在下面：準備工作： 1、haoop叢集環境搭建完成 2、新建一個檔案hello,並寫入2行單詞，如下： [[email protected] hadoop-2.6.0]# vi hello hello

Hadoop實戰（一），單詞計數（wordcount）

目的通過特定Hadoop Demo實戰，瞭解、學習、掌握大資料框架日常使用及嘗試挑戰大資料研發過程中遇到的挑戰等。場景描述運用MapReduce 進行簡單的單詞計數統計。實驗

spark讀hdfs檔案實現wordcount並將結果存回hdfs

package iie.udps.example.operator.spark; import scala.Tuple2; import org.apache.spark.SparkConf; import org.apache.spark.api.java.Jav

map/reduce例項wordCount單詞計數實現功能

hadoop hadoop hadoop dajiangtai dajiangtai dajiangtai hsg qq.com hello you hello me her map/reduce處理功能執行步驟： 1. map任務處理

大數據學習日誌——java編寫hadoop的mapreduce實現wordcount功能

int bsp exceptio 輸入參數長度 con 服務配置參數 getc 1 package mapreduce; 2 3 import org.apache.hadoop.conf.Configuration; 4 import or

使用IDEA實現HDFS客戶端的簡單操作

新增依賴 <dependency> <groupId>junit</groupId> <artifactId>junit</artifactId>

IDEA用法總結之三（以及總結今天用IDEA實現spring+springmvc+mongodb的後臺專案）

專案名為wanan 在IDEA上使用IDEA的時候：說明一下之前在IDEA用法總結之二的時候，用IDEA add fram來新增架構，完全沒有必要，這裡要注意的是pom.xml 檔案的編寫，寫好了就可以直接用！！！！！下面是主要參考的部落格先建立一個maven-arch

spark-streaming 程式設計(二) word count單詞計數統計

就那官方的例子來說明，程式碼基本上有註釋 package com.lgh.sparkstreaming import org.apache.spark.SparkConf import org.apache.spark.storage.StorageLe

SPARK官方例項：兩種方法實現隨機森林模型（ML/MLlib）

在spark2.0以上版本中，存在兩種對機器學習演算法的實現庫MLlib與ML，比如隨機森林：org.apache.spark.mllib.tree.RandomForest 和org.apache.spark.ml.classification.RandomForestCl

ztree實現權限功能（橫向顯示）

lose false 標記 console 多人性能優化發現測試 func 最近在做權限功能的時候，采用的ztree實現的，但是產品要求最後一層的權限節點要橫向顯示。開始在網上找的解決方案是用css樣式把最後一層的display設置為inline。在我本地電腦上看了下

純SQL實現小算法（輔助決策）_ 計算商品評分、及時補貨

mysql分別把計算各自的 1、點擊量/點擊量均值 2、銷售量/銷售量均值兩者相加，可以得到一個簡單評分又有問題了，豬肉的評分不應該比五花肉多。因此我們要加入簡單的權重，譬如點擊量評分占30%。銷售量評分占70%select p_type,p_name, (p_view/view_avg)

phpqrcode實現二維碼（含圖片）

level con 二維碼輸出 code evel eba hello include ---恢復內容開始--- 1，http://phpqrcode.sourceforge.net/ 下載 2，解壓以後只需要一個文件　 3，原生php測試：　　 <?ph

Scala +Spark+Hadoop+Zookeeper+IDEA實現WordCount單詞計數（簡單例項）

IDEA+Scala +Spark實現wordCount單詞計數

一、新建一個Scala的object單例物件，修改pom檔案

二、Scala 程式碼

三、在伺服器上面啟動Hadoop的hdfs和spark（我這兒啟動的hdfs的高可用）

完美~~

歡迎訂閱關注公眾號（JAVA和人工智慧）

獲取更多免費書籍、資源、視訊資料

相關推薦