Kafka 學習筆記（3）——kafka java API

阿新 • • 發佈：2018-12-12

1 新建maven 工程

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>com.tzb.cn</groupId>
    <artifactId>tzbkafka</artifactId>
    <version>1.0-SNAPSHOT</version>


    <dependencies>
        <dependency>
            <groupId>org.apache.kafka</groupId>
            <artifactId>kafka_2.8.2</artifactId>
            <version>0.8.1</version>
        </dependency>
    </dependencies>

</project>

2 生產者原始碼

KafkaProducerSimple.java

package demo;

import kafka.javaapi.producer.Producer;
import kafka.producer.KeyedMessage;

import kafka.producer.ProducerConfig;

import java.util.Properties;
import java.util.UUID;

public class KafkaConsumerSimple {

    public static void main(String[] args) {

        /*
         * 1. 指定當前 kafka producer 生產的資料目的地
         * */ 

        String TOPIC = "orderMq";

        /*
         * 2. 讀取配置檔案
         * */
        Properties props = new Properties();
        //key.serializer.class預設為serializer.class
        props.put("serializer.class", "kafka.serializer.StringEncoder");
        //kafka broker對應的主機
        props.put("metadata.broker.list" 
, "node1:9092,node2:9092,node3:9092");
        /*
         * request.required.acks,設定傳送資料是否需要服務端的反饋,有三個值0,1,-1
         * 0，意味著producer永遠不會等待一個來自broker的ack，這就是0.7版本的行為。
         * 這個選項提供了最低的延遲，但是持久化的保證是最弱的，當server掛掉的時候會丟失一些資料。
         * 1，意味著在leader replica已經接收到資料後，producer會得到一個ack。
         * 這個選項提供了更好的永續性，因為在server確認請求成功處理後，client才會返回。
         * 如果剛寫到leader上，還沒來得及複製leader就掛了，那麼訊息才可能會丟失。
         * -1，意味著在所有的ISR都接收到資料後，producer才得到一個ack。
         * 這個選項提供了最好的永續性，只要還有一個replica存活，那麼資料就不會丟失
         */
        props.put("request.required.acks", "1");

        /*
         * 可選配置，如果不配置，則使用預設的partitioner partitioner.class
         * 預設值：kafka.producer.DefaultPartitioner
         * 用來把訊息分到各個partition中，預設行為是對key進行hash。
         */
        props.put("partitioner.class", "demo.MyLogPartitioner");
        //props.put("partitioner.class", "kafka.producer.DefaultPartitioner");

        /*
         * 3.通過配置檔案，建立生產者
         * */
        Producer<String, String> producer = new Producer<String, String>(new ProducerConfig(props));


        /*
         * 4.通過 for 迴圈生產資料
         * */
        for (int messageNo = 1; messageNo < 100000; messageNo++) {

            producer.send(new KeyedMessage<String, String>(TOPIC, messageNo + " ", " appid  --  " + UUID.randomUUID() + "consumertest"));
        }

    }

}

MyLogPartitioner.java

package demo;

import kafka.producer.Partitioner;
import kafka.utils.VerifiableProperties;
import org.apache.log4j.Logger;


public class MyLogPartitioner implements Partitioner {
    private static Logger logger = Logger.getLogger(MyLogPartitioner.class);

    public MyLogPartitioner(VerifiableProperties props) {
    }

    public int partition(Object obj, int numPartitions) {
        //return Integer.parseInt(obj.toString())%numPartitions;
        return 1;
    }

}

3 消費者

package demo;


import kafka.consumer.Consumer;
import kafka.consumer.ConsumerConfig;
import kafka.consumer.ConsumerIterator;
import kafka.consumer.KafkaStream;
import kafka.javaapi.consumer.ConsumerConnector;
import kafka.message.MessageAndMetadata;

import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Properties;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;

public class KafkaConsumerSimple implements Runnable {

    public String title;
    public KafkaStream<byte[], byte[]> stream;

    public KafkaConsumerSimple(String title, KafkaStream<byte[], byte[]> stream) {
        this.title = title;
        this.stream = stream;
    }


    public void run() {
        System.out.println("開始執行" + title);
        ConsumerIterator<byte[], byte[]> it = stream.iterator();

        /**
         * 不停地從stream讀取新到來的訊息，在等待新的訊息時，hasNext()會阻塞
         * 如果呼叫 `ConsumerConnector#shutdown`，那麼`hasNext`會返回false
         * */
        while (it.hasNext()) {
            MessageAndMetadata<byte[], byte[]> data = it.next();
            String topic = data.topic();
            int partition=data.partition();
            long offset=data.offset();
            String msg=new String(data.message());
            System.out.println(String.format(
                    "Consumer: [%s],  Topic: [%s],  PartitionId: [%d], Offset: [%d], msg: [%s]",
                    title, topic, partition, offset, msg));
        }

        System.out.println(String.format("consumer:[%s] exiting....",title));

    }


    public static void main(String[] args){
        Properties props=new Properties();
        props.put("group.id","myconsumer");
        props.put("zookeeper.connect","ndoe1:2181,node2:2181,node3:2181");
        props.put("auto.offset.reset","largest");
        props.put("auto.commit.interval.ms","1000");
        props.put("partition.assigment.strategy","roundrobin");
        ConsumerConfig config=new ConsumerConfig(props);

        String topic="orderMq";

        //只要ConsumerConnector 換在，consumer 會一直等待新訊息，不會退出
        ConsumerConnector consumerConn = Consumer.createJavaConsumerConnector(config);

        Map<String,Integer> topicCountMap=new HashMap<String, Integer>();
        topicCountMap.put(topic,4);

        //Map<String, List<KafkaStream<byte[], byte[]>> 中String是topic， List<KafkaStream<byte[], byte[]>是對應的流
        Map<String, List<KafkaStream<byte[], byte[]>>> topicStreamsMap = consumerConn.createMessageStreams(topicCountMap);
        //取出 `kafkaTest` 對應的 streams
        List<KafkaStream<byte[], byte[]>> streams = topicStreamsMap.get(topic);
        //建立一個容量為4的執行緒池
        ExecutorService executor = Executors.newFixedThreadPool(3);
        //建立20個consumer threads
        for (int i = 0; i < streams.size(); i++)
            executor.execute(new KafkaConsumerSimple("消費者" + (i + 1), streams.get(i)));
    }}

Kafka 學習筆記（3）——kafka java API

1 新建maven 工程 <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi=

Kafka學習筆記（3）----Kafka的資料複製（Replica）

1. CAP理論　　1.1 Cosistency(一致性) 　　通過某個節點的寫操作結果對後面通過其他節點的讀操作可見。　　如果更新資料後，併發訪問的情況下可立即感知該更新，稱為強一致性　　如果允許之後部分或全部感知不到該更新，稱為弱一致性。　　若在之後的一段時間（通常該時間不是固定的）後，

HBase學習筆記（3）—— hbase java API

1 hbase依賴zookeeper 儲存Hmaster的地址和backup-master地址管理HregionServer 做增刪改查表的節點管理HregionServer中的表分配儲存表-ROOT-的地址 hbase預設的根表，檢索表。 HRe

Kafka學習筆記（1）----Kafka的簡介和Linux下單機安裝

1. Kafka簡介　　Kafka is a distributed,partitioned,replicated commit logservice。它提供了類似於JMS的特性，但是在設計實現上完全不同，此外它並不是JMS規範的實現。kafka對訊息儲存時根據Topic進行歸類，傳送訊息者成為Produ

Kafka學習筆記（5）----Kafka的Consumer

1. Pull vs Push 　　Producer主動的通過push將訊息釋出到Broker上，Consumer通過Pull的的方式從Broker訊息訊息。　　通過Push的方式由於是一有訊息就推到Broker,所以極大的保證了訊息實時性，但是在某些情況下，可能由於Consumer網路，或是其他原因倒

Kafka學習筆記（5）----Kafka使用Producer傳送訊息

1. Kafka的Producer 　　不論將kafka作為什麼樣的用途，都少不了的向Broker傳送資料或接受資料，Producer就是用於向Kafka傳送資料。如下：　　 2. 新增依賴　　pom.xml檔案如下： <!-- https://mvnrepository.com/

Kafka學習筆記（7）----Kafka使用Cosumer接收訊息

1. 什麼是KafkaConsumer? 　　應用程式使用KafkaConsul'le 「向Kafka 訂閱主題，並從訂閱的主題上接收訊息。Kafka的訊息讀取不同於從其他訊息系統讀取資料，它涉及了一些獨特的概念和想法。　　1.1 消費者和消費者群組　　單個的消費者就跟前面的訊息系統的消費者一樣，建

Java暑期學習筆記（3）

ring out 顯示字節數順序作用提示 string轉換 gbk # 2018.7.11 # * 1.匿名內部類(只針對重寫一個方法時候使用，不能向下轉型，因為沒有子類類名) * new Inter(){ public

kafka學習筆記（一）

首先，kafka是什麼： kafka 是一個分散式訊息佇列系統，用於大資料分析，其中主要是日誌分析系統：然後思考一下以下幾個場景: 我想分析一下使用者行為（pageviews），以便我能設計出更好的廣告位我想對使用者的搜尋關鍵詞進行統計，分析出當前的流行趨勢。這個很

Java核心技術卷I 基礎知識學習筆記（3）

參考：Java核心技術卷I 基礎知識類之間最常見的關係有：依賴、聚合、繼承依賴即“use-a”關係，是一種最明顯的，最常見的關係。如果一個類的方法操作另一個類的物件，就說一個類依賴於另一個類。應該儘可能地將相互依賴的類減至最少。聚合即“has-a”關係，是一種具體且

Kafka 學習筆記（5）—— flume + kafka 整合（1）

1 需求分析採集訂單系統應用列印的日誌檔案。日誌檔案使用 log4j 生成，滾動生成。將採集的日誌檔案儲存到 kafka中。（source）輸入： tail -F xx.log

jvm學習筆記（3）——java物件的記憶體分配和物件的回收（GC）

引言：之前的文章已經提過，java物件例項是存放在堆上的，至於是在伊甸區、存活區還是老年區，這些都是從物件回收（GC）角度來進行的邏輯劃分。所以我們先說物件的回收（GC），然後再依據GC的策略來說明新的物件具體在哪個區生成。 GC（Garbage C

Kafka 學習筆記（二）

上一篇介紹了kafka的特點，這篇來記錄kafka的主要工作方式： 1.建立Topic， 2. 生產者生產 3.消費者消費首先建立一個 test topic，命令如下： ./kafka-topics.sh --zookeeper 172.28.201.217:2181 -

java學習筆記（3）

1.random使用 package daigua3; import java.util.Random; public class Random1 { public static void main(String[] args) { Random r = new Random();

Java 虛擬機器學習筆記（3）——垃圾回收機制

一. 為什麼需要“垃圾”回收 1.什麼是“垃圾”？此處講的“垃圾”分為兩種：廢棄常量和無用的類。廢棄常量，主要是判斷當前系統中有沒有物件引用這個常量；無用類則比較嚴格，需要滿足下面三個條件：（1）該類的

Kafka 學習筆記（八）之producer讀取file

要想讓Kafka用到實際中，就需要學會讓Kafka從檔案中讀取內容，傳送到topic裡，以供consumer讀取。我們以前的幾篇，自己產生data的，不是從file中讀的。之前先下載好scp，scp是secure copy的簡寫，用於在Linux下進行遠端拷貝檔案的命令。

kafka 學習筆記（四）之Python客戶端

今天看看Python客戶端。程式碼在github上，和以前一樣，我們用github上寫好的程式碼進行測試 https://github.com/mumrah/kafka-python pip install git+git://github.com/mumrah/kafk

JAVA學習筆記（3）方法

1. 方法的語句結構：修飾符返回值型別方法名（引數列表）{ //方法體； } 1) 修飾符，返回值型別，方法名和引數構成方法頭，其中修飾符可選。 2) 對於有返回值的方法，返回值型別就是要返回的值

Kafka學習筆記（四）—— API使用

1、Producer API 1.1 訊息傳送流程 Kafka的Producer傳送訊息採用的是非同步傳送的方式。在訊息傳送的過程中，涉及到了兩個執行緒——main執行緒和Sender執行緒，以及一個執行緒共享變數——RecordAccumulator。main執行緒將訊息傳送給RecordAccumulat

TCP/IP詳解學習筆記（3）IP協議ARP協議和RARP協議

out 處理機傳輸包含發送 res 這也進行默認把這三個協議放到一起學習是因為這三個協議處於同一層，ARP協議用來找到目標主機的Ethernet網卡Mac地址，IP則承載要發送的消息。數據鏈路層可以從ARP得到數據的傳送信息，而從IP得到要傳輸的數據信息。　　

Kafka 學習筆記（3）——kafka java API

1 新建maven 工程

2 生產者原始碼

3 消費者

相關推薦