將Streaming拉取的資料存入redis中

阿新 • • 發佈：2018-12-27

啟動redis: ./redis-cli -h hadoop01

package utils

import org.apache.commons.pool2.impl.GenericObjectPoolConfig
import redis.clients.jedis.{Jedis, JedisPool}

/**
  * 建立jedis連線池
  */
object Jpools {
   private val poolConfig = new GenericObjectPoolConfig()
  poolConfig.setMaxIdle(5)//最大的空閒連線數
  poolConfig.setMaxTotal(2000)//支援最大的連線數
  //連線池不需要對外提供訪問
  private lazy val jedisPool = new JedisPool(poolConfig,"hadoop01")

  /**
    * 對外提供一個可以從池子裡面獲取連線的方法
    * @return
    */
  def getJedis :Jedis={
    val jedis = jedisPool.getResource
    jedis.select(1)
    jedis
  }
}

package shujuku

import org.apache.spark.rdd.RDD
import org.apache.spark.streaming.dstream.ReceiverInputDStream
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.{SparkConf, SparkContext}
import utils.Jpools

/**
  * 將實時統計的詞頻寫入到redis裡面
  */
object WordCountRedis {
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setMaster("local[*]").setAppName("WordCountRedis")
    
    //每2秒鐘取樣一次資料
    //第二個引數是批次時間間隔,多長時間的資料集作為一個批次,這個時間不能隨意設定,必須是科學合理的設定,只有這樣才能穩定執行
    val ssc = new StreamingContext(conf,Seconds(3))
    //接收資料
    val words: ReceiverInputDStream[String] = ssc.socketTextStream("hadoop01",1235)
    
    words.foreachRDD(rdd=>{
      //計算當前批次結果
      val current_batch_result: RDD[(String, Int)] = rdd.flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_)

      //把計算好的當前批次結果寫到redis
      current_batch_result.foreachPartition(partition=>{
        //每個分割槽從池子裡獲取一個連線物件
       val jedis= Jpools.getJedis
        partition.foreach(tp=>{
        //redis的特性hincrby
          jedis.hincrBy("wordcount",tp._1,tp._2)
        })
        //用完之後,記得文明
        jedis.close()
      })
    })
    ssc.start()
    ssc.awaitTermination()
  }
}

將Streaming拉取的資料存入redis中

啟動redis: ./redis-cli -h hadoop01 package utils import org.apache.commons.pool2.impl.GenericObjectPoolConfig import redis.clients.j

spark streaming 中 direct 直連方式從kafka中怎麼拉取資料

我們知道 SparkStreaming 用 Direct 的方式拉取 Kafka 資料時，是根據 kafka 中的 fromOffsets 和 untilOffsets 來進行獲取資料的，而 fromOffsets 一般都是需要我們自己管理的，而每批次的 untilOffse

將資料存入mysql中

import pymysql import warnings # 忽略警告 warnings.filterwarnings("ignore") # 連線資料庫 db = pymysql.connect("localhost", 'root', "123456", charset="utf8") #

將資料庫資料放到redis中並保持資料一致性方案

1、查詢時先查詢快取（redis）,如果查詢不到，查詢資料庫，並將會員唯一標識（會員編號），放到redis佇列中（list） 2、啟動一個job從redis佇列中讀取會員唯一標識，並判斷會員編號作為key是否存在於redis中，如果存在，計數器減一，否則直接查詢會員資訊，放

將資料存入redis進行讀取資料

<?php header("content-type:text/html;charset=utf8"); $page=isset($_GET['page'])?$_GET['page']:1;//判斷有沒有頁數，如果沒有頁數的話從一開始 $

專案總結：每隔5分鐘從資料庫拉取資料轉為Json格式通過WebService從客戶端傳送至服務端

第一次接手需求寫的小專案，過程也有點坎坷，以此記錄總結編碼過程中遇到的問題。專案背景：本次寫的是一個小模組，主要為客戶端，作用是每隔5分鐘從資料庫拉取資料傳送至服務端。本次專案採用的是spring3+Quartz+JdbcTemplate+J

python中把資料存入csv中

import csv # 如果不新增newline=""的話，就會每條資料中間都會有空格行 with open("test.csv","w", newline="") as csvfile: # 初始化寫入物件 writer = csv.writer(csvfile) #先

Python爬蟲爬取資料存入MongoDB

from bs4 import BeautifulSoup import requests import time import pymongo client = pymongo.MongoClient('Localhost', 27017) ceshi = client[

java rfc 拉取資料

1. 連線rfc 1 package com.simpro.sapapi.util; 2 3 import java.io.File; 4 import java.io.FileOutputStream; 5 import java.util.Properties; 6 7 im

java JTable 動態拉取資料顯示及自動重新整理

網上有很多關於這方面的介紹，但是寫的要麼含糊，要麼不全，很容易讓開發者更加糊塗，本人最初也是這樣，所以在這裡把JTable 的動態資料拉取顯示以及自動重新整理的方法整理一下。 JTable在java api中有下列幾種構造方法：構造方法摘要

ListView分頁載入，動態從網上拉取資料

最近做專案有個需求：（1）從網上獲取分頁資料；（2）在Android手機端顯示；（3）載入的動畫和文字；（4）資料超過40條時顯示滑動條等。由於之前自己做的偏底層一點，所以這塊內容琢磨了蠻久，最後可以完美實現專案需求，內容見下面：一、首先，需要有個佈局

git使用命令列拉取遠端程式碼倉庫中的分支至本地

1、本地建立資料夾用於存放拉取的程式碼 2、執行git init初始化資料夾 3、與遠端程式碼倉庫建立連線　　git remote add origin [email protected]/nothing.git(遠端程式碼倉庫連結地址) 4、切換分支拉取程式碼（wyl為遠端程式碼倉庫分支

2000w資料，redis中只存放20w的資料，如何保證redis中的資料都是熱點資料

redis 記憶體資料集大小上升到一定大小的時候，就會施行資料淘汰策略。 redis 提供 6種資料淘汰策略：voltile-lru：從已設定過期時間的資料集（server.db[i].expires）中挑選最近最少使用的資料淘汰 volatile-ttl：從已設定過期時間的資料集（server.db[i

將一個類的屬性存入MAP中（key為屬性名，value為屬性值）

有時候需要將javaBean與Map互轉，寫個方法（只寫了javaBean轉為Map，Map轉為javaBean比較簡單），供大家參考 /** * 獲取obj中的所有方法 * @param obj * @return */ public List<

python 遠端連線MySQL資料庫拉取資料存至本地檔案

1.連線資料庫這裡預設大家都已經配置安裝好 MySQL 和 Python 的MySQL 模組，且預設大家的DB內表和訪問賬號許可權均已設定無誤，下面直接程式碼演示： # -*- codin

PHP抓取資料的3中形式

什麼叫採集？就是使用PHP程式，把其他網站中的資訊抓取到我們自己的資料庫中、網站中。 PHP製作採集的技術：從底層的socket到高層的檔案操作函式，一共有3種方法可以實現採集。 1. 使用socket技術採集： socket採集是最底層的，它只是建立了一個長連線，然

將Date型別的資料存入資料庫

在web開發中有時需要將表單中資料已Date型別存入資料庫。 1：在form表單中 <form action="addgameservlet" method="post" >

kafka-storm spout拉取資料問題offset out of range

131236985 [Thread-15-spout] WARN storm.kafka.KafkaUtils - Got fetch request with offset out of range: [14026]; retrying with defau

Session通過轉byte陣列存入redis中

由於目前redis僅支援五大型別資料，經測試發現將session存入redis中讀取時會報錯不支援此資料型別，但是寫入是不報錯的。（背景）本人用shiro做單點登入，session寫入redis中，子應用從redis中讀取在校驗許可權。（現象）網上很多資料都是直接將s

angular2下用http到由SpringMVC釋出rest服務的伺服器端拉取資料

本文講述如何使用angular2的http服務來去一臺由SpringMVC釋出的rest服務的伺服器上拉取資料。我們現來上服務端程式碼, @ResponseBody @RequestMapping("/hero") public Object getDa

將Streaming拉取的資料存入redis中

相關推薦