Как я могу создать Multiconsumer для одной очереди на apache kafka?

Привет, в моем сценарии есть очередь, в которую множество ресурсов помещают сообщения в эту очередь, и многие потребители читают сообщения и выполняют определенную работу.

для этого сценария я создаю тему в Kafka с помощью этой команды

bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test1

теперь я разрабатываю класс Java для его использования

public class ConsumerGroupExample {

    private final ConsumerConnector consumer;
    private final String topic;
    private  ExecutorService executor;

    public ConsumerGroupExample(String a_zookeeper, String a_groupId, String a_topic) {
        consumer = kafka.consumer.Consumer.createJavaConsumerConnector(
                createConsumerConfig(a_zookeeper, a_groupId));
        this.topic = a_topic;
    }

    public void shutdown() {
        if (consumer != null) consumer.shutdown();
        if (executor != null) executor.shutdown();
        try {
            if (!executor.awaitTermination(5000, TimeUnit.MILLISECONDS)) {
                System.out.println("Timed out waiting for consumer threads to shut down, exiting uncleanly");
            }
        } catch (InterruptedException e) {
            System.out.println("Interrupted during shutdown, exiting uncleanly");
        }
   }

    public void run(int a_numThreads) {
        Map<String, Integer> topicCountMap = new HashMap<String, Integer>();
        topicCountMap.put(topic, new Integer(a_numThreads));
        Map<String, List<KafkaStream<byte[], byte[]>>> consumerMap = consumer.createMessageStreams(topicCountMap);
        List<KafkaStream<byte[], byte[]>> streams = consumerMap.get(topic);

        // now launch all the threads
        //
        executor = Executors.newFixedThreadPool(a_numThreads);

        // now create an object to consume the messages
        //
        int threadNumber = 0;
        for (final KafkaStream stream : streams) {
            executor.submit(new ConsumerTest(stream, threadNumber));
            threadNumber++;
        }
    }

    private static ConsumerConfig createConsumerConfig(String a_zookeeper, String a_groupId) {
        Properties props = new Properties();
        props.put("zookeeper.connect", a_zookeeper);
        props.put("zookeeper.session.timeout.ms", "400");
        props.put("zookeeper.sync.time.ms", "200");

        props.put("group.id", a_groupId);
        props.put("num.consumer.fetchers", "2");
        props.put("partition.assignment.strategy", "roundrobin");
        props.put("auto.commit.interval.ms", "1000");

        return new ConsumerConfig(props);
    }

    public static void main(String[] args) {

        String zooKeeper = "tls.navaco.local:2181";
        String groupId = "group1";
        String topic = "test1";
        int threads = 4;

        ConsumerGroupExample example = new ConsumerGroupExample(zooKeeper, groupId, topic);
        example.run(threads);

        while (true) {}

    }

и еще один класс Java для создания сообщений

public class TestProducer {

    public static void main(String[] args) {
        Properties props = new Properties();

        props.put("metadata.broker.list", "tls.navaco.local:9092");
        props.put("serializer.class", "kafka.serializer.StringEncoder");
        props.put("request.required.acks", "1");
        ProducerConfig config = new ProducerConfig(props);

        Producer p = new Producer<String, String>(config);

        //sending...
        String topic = "test1";
        String message = "Hello Kafka";
        for (int i = 0; i < 1000; i++) {
            KeyedMessage<String, String> keyedMessage = new KeyedMessage<String, String>(topic, message + i);
            p.send(keyedMessage);           
        }
    }

}

, и, как сказано в документе Apache, если тема хочет действовать как очередь, потребитель должен иметь тот же group.id, что я и сделал, но когда я запускаю 2, 3 или больше потребителей, только один из них получает сообщения, а остальные ничего не делали.

На самом деле я хочу очередь, и порядок для меня не важен, для меня важно то, что каждое сообщение просто и просто потребляется одним потребителем.

Интересно, можно ли реализовать это в Kafka или мне следует использовать другой продукт, такой как ActiveMQ, HornetMQ, .....?


person AKZ    schedule 11.04.2015    source источник


Ответы (1)


Количество разделов — это единица параллелизма в Kafka. Поскольку у вас есть только один раздел в теме, только один потребитель в группе может потреблять сообщения темы. Если вы хотите, чтобы три получателя в группе одновременно получали сообщения, вы должны увеличить количество разделов до 3 или более. Дополнительные сведения см. в разделе Потребители документации Kafka.

person Heejin    schedule 11.04.2015
comment
Я знал это, но на самом деле в производственном режиме потребитель может динамически увеличиваться или уменьшаться, для обработки производительности я точно не знаю, сколько у меня потребителей в производстве, на основе которых я создаю раздел для каждой темы. - person AKZ; 11.04.2015
comment
Вам не нужно заранее знать количество потребителей: количество разделов — это просто максимальный уровень параллелизма. У вас может быть один единственный потребитель, читающий со всех разделов. - person sandris; 13.04.2015