scala用actor併發程式設計寫一個單機版的WorldCount（類似Hadoop的MapReduce思想）

阿新 • • 發佈：2019-01-29

1、準備資料，2個檔案

words.txt

內容：

lilei hello
zhangsan hello
lisi hello
蘇三 hello

words.log

內容：

lilei hello
zhangsan hello
lisi hello

2、環境Intellj IDEA scala外掛

3、程式碼

package p1
import scala.actors.{Actor, Future}
import scala.collection.mutable
import scala.io.Source

//模式匹配類，用於提交任務
case class SubmitTask(fileName:String)
//單例的模式匹配類，用於停止任務
case object  StopTask
//用於收集分組後結果的
case class ResultTask(result:Map[String,Int])
/**
  * scala Actor構建在java的執行緒基礎之上的，
  * 為了避免頻繁的執行緒建立、銷燬和切換等，scala中提供了react方法
  * 方法執行完畢後，仍然被保留
  */
class Task extends Actor{

   override def act(){
      loop{//重複執行一個程式碼塊
         react{
            case SubmitTask(fileName)=>{
               val result=Source.fromFile(fileName,"gb2312").getLines()//獲取檔案,有中文-編碼，每一行生成一個List集合
                     .flatMap(_.split(" ")).map((_,1)).toList//把上面所有集合壓縮成一個集合，再切分，再生成map-（“單詞”,1）
                     .groupBy(_._1).mapValues(_.size)//按照key分組，value就是分組後map的數量
               sender ! ResultTask(result)//把單個檔案的統計結果輸出，！代表非同步執行
            }
            case StopTask=>{
               exit()
            }
         }
      }
   }
}
object WorkCount{
   def main(args: Array[String]) {
      //要讀取的檔案
      val files=Array("E://words.txt","E://words.log")
      val replaySet=new mutable.HashSet[Future[Any]]
      val resultList=new mutable.ListBuffer[ResultTask]

      //每個檔案啟動一個執行緒，非同步提交，replaySet接收返回的值
      for(f<-files){
         val t=new Task
         val replay=t.start() !! SubmitTask(f)
         replaySet+=replay
      }
      while(replaySet.size>0){
         //檢查replaySet中是否有執行完Future,過濾出來
         val toCompute=replaySet.filter(_.isSet)
         for(r<-toCompute){
            //r.apply()等價於r()取出r物件
            val result=r.apply()
            //取出的物件進行強轉，放到resultList中
            resultList+=result.asInstanceOf[ResultTask]
            //操作完一個移除一個，避免重複
            replaySet.remove(r)//replaySet -=r
         }
         Thread.sleep(100)//睡一會避免死迴圈,等待所有任務執行完
      }
      //最終resultList中的資料是每個檔案處理好的esultTask(Map[String,Int])集合
      //此步驟類似於hadoop裡的reducer
      val finalResult=resultList.map(_.result)//變成List裡裝的很多map格式
                      .flatten.groupBy(_._1)//壓縮分組
                      .mapValues(x=>x.foldLeft(0)(_+_._2))//累加
      //列印結果
      println(finalResult)
   }
}

5、結果

Map(lisi -> 2, 蘇三 -> 1, lilei -> 2, hello -> 7, zhangsan -> 2)

scala用actor併發程式設計寫一個單機版的WorldCount（類似Hadoop的MapReduce思想）

1、準備資料，2個檔案 words.txt 內容： lilei hello zhangsan hello lisi hello 蘇三 hello words.log 內容： lilei hello zhangsan hello lisi hello 2、環境Intell

scala 用actor併發統計詞頻

import scala.actors.{Actor, Future}import scala.collection.mutableimport scala.io.Sourcecase class MySend(file: String)case class MyRecieve(msg: Map[String

C#自寫的一個HTML解析類（類似XElement語法）

功能： 1、輕鬆獲取指元素HTML元素。 2、可以根據屬性標籤進行篩選 3、返回的都是Llist強型別無需轉換用過XElement的都知道用來解析XML非常的方便，但是對於HTML的格式多樣化實在是沒辦法相容。所以我就寫了這麼一個類似XElement的 XHTMLEl

Hadoop-2.9.2單機版安裝（偽分散式模式）

一、環境硬體：虛擬機器VMware、win7 作業系統：Centos-7 64位主機名： hadoopServerOne 安裝使用者：root軟體：jdk1.8.0_181、Hadoop-2.9.2 二、安裝jdk 1.建立hadoop目錄，並賦許可權chmod 777 hadoop2.下載jdk-

Scala Actor併發程式設計

Java中的併發程式設計主要通過執行緒實現的，通過共享資源的機制實現併發，但會面臨著死鎖的問題。在Scala中，是通過訊息傳遞來實現併發的，而Actor正是實現訊息傳遞的。 Scala的actor提供了一種基於事件的輕量級執行緒。只要使用scala.actors.Ac

Scala系列——Scala Actor併發程式設計

一、基本介紹 1、概念 Scala中的Actor能夠實現並行程式設計的強大功能，它是基於事件模型的併發機制，Scala是運用訊息（message）的傳送、接收來實現多執行緒的。使用Scala能夠更容易地實現多執行緒應用的開發。 2、傳統java併發程式

用jquery插件寫一個小米官網左側二級菜單

前端源碼 jquery javascript 插件知識點：靜態布局思路，jquery動態布局，代碼格式規範，jquery插件調用，鼠標滑動二級菜單構建。 html代碼： <div id="Tz_banner"> <ul>

用react + redux + router寫一個todo

有用 Redux 升級開發代碼 git 我只 ima 參考概述最近學習redux，打算用redux + router寫了一個todo。記錄下來，供以後開發時參考，相信對其他人也有用。註意：我只實現了Footer組件的router，其它組件的實現方法是類似的。

LeanCloud SDK不好用，Python手寫一個ORM

Intro 慣例，感覺寫了好用的東西就來寫個部落格吹吹牛逼。 LeanCloud Storage 的資料模型不像是一般的 RDBMS，但有時候又很刻意地貼近那種感覺，所以用起來就很麻煩。 LeanCloud SDK 的缺陷不管別人認不認可，這些問題在使用中我是體會到不爽了。資

用html/css簡單寫一個心形，表白必學

1，建議大家使用Sublime編輯軟體去編寫，先給大家看個效果圖標題二，教程開始，影象是由三個影象合成的，兩個圓形，一個正方形，大部分用div佈局完成的 1，首先建一個大的div 效果圖 2，建一個圓形，首先畫一個正方形，新建多一個div，

用Java語言如何寫一個小日曆

利用GregorianCalendar物件內部的get方法 getFirstDayweek方法獲得當地星期的起始日。我們不必知道GregorianCalendar類如何計算星期數與天數。掌握set與get，add方法。在這裡插入程式碼片 ```package

用vue+Element-ui寫一個後臺管理介面,點選頭部導航對應顯示下方左側導航選單,點選左側選單對應顯示右邊內容,點選右邊內容的按鈕出現一個新頁面依舊能夠選中左側相應選單,求解決???!!!!

vue-路由用vue+Element-ui寫一個後臺管理介面,點選頭部導航對應顯示下方左側導航選單,點選左側選單對應顯示右邊內容但是點選新建微帖路由出現一個新頁面,左側選單怎麼才能顯示被選中狀態,就是跟上圖狀態一樣??? 這裡是左側選單導航和右邊內容顯示區域程式碼這裡是頁面按鈕

Java併發程式設計之鎖機制之ReentrantReadWriteLock（讀寫鎖）

前言在前面的文章中，我們講到了ReentrantLock(重入鎖)，接下來我們講ReentrantReadWriteLock（讀寫鎖），該鎖具備重入鎖的可重入性、可中斷獲取鎖等特徵，但是與ReentrantLock不一樣的是，在ReentrantReadWriteLock中，維護了一對鎖，一個讀鎖一個寫鎖

Actor併發程式設計模型淺析

一.Actor模型介紹在單核 CPU 發展已經達到一個瓶頸的今天，要增加硬體的速度更多的是增加 CPU 核的數目。而針對這種情況，要使我們的程式執行效率提高，那麼也應該從併發方面入手。傳統的多執行緒方法又極其容易出現 Bug 而難以維護，不過別擔心，今天將要介紹另一種併發的模式能一定程度解決這些問題，那就是

用QT庫寫的一個小遊戲——FlappyBird（憤怒的小鳥）

最近瀏覽網站的時候，忘記在哪裡看的這個FlappyBird了，這個小遊戲在前兩年小火了一段時間。今天用QT簡單的實現了一把，然後在網上找了一些相關的切圖，便進行了製作。難度不是很大，只是通過寫這篇部落格，能有點啟發以及大家共同學習。如果你對C語言C++感興趣，那麼歡迎加入學

用PHP和HTML寫一個簡單的網站登入註冊專案

首先，這是一個很簡單的登陸註冊頁面，請不要在意美觀及設計，重點在於登入註冊這個功能。這個專案由五個分頁組成： 1.index.php ：一個簡單的首頁，有login register，當用戶登入之後，在cookie的有效期內，這兩個按鈕會變成使用者名稱。 2.login.

Scala 並行和併發程式設計-Futures 和 Promises

最近看了《七週七語言：理解多種程式設計泛型》，介紹了七種語言（四種程式設計泛型）的主要特性：基本語法，集合，並行/併發，其中就有 Scala。你不能指望這種書全面介紹，因為其中任何一門語言都夠寫一本書了~ 我比較關注並行/併發，但是書中關於 Scala 的併發部分——A

介面程式設計-寫一個滑動條

//滑動條 class SliderChunk:public ButtonChunk { public: short nSliderLeft; short nSliderRight; sh

教你做一個單機版人事管理系統（Winform版）treeview與listview使用詳情

不讓 ogr lena 位置 exc bject tel horizon raw ------------------------------------------------------------------部門部分--------------------------

手寫一個簡化版Tomcat

exc ext login 變量請求參數 finally engine catch container 一、Tomcat工作原理我們啟動Tomcat時雙擊的startup.bat文件的主要作用是找到catalina.bat，並且把參數傳遞給它，而catali

scala用actor併發程式設計寫一個單機版的WorldCount（類似Hadoop的MapReduce思想）

相關推薦