Публикации по теме 'apache-kafka'


Создание масштабируемой базы данных в реальном времени
Демонстрация и руководство по интеграции ClickHouse с Redpanda для создания базы данных OLAP. Это сообщение изначально было опубликовано в блоге Redpanda . Многие компании, которые ежедневно собирают и анализируют огромные объемы данных, создают еще больше данных, когда сообщают о своих выводах. Поскольку эти компании и их данные продолжают расти, анализ данных в режиме реального времени становится все более и более важным. Чем больше необработанных данных, тем больше данных для..

Введение в темы и разделы Kafka
В Apache Kafka есть несколько вещей, не менее важных, чем темы. Это то, с чем вы сразу столкнетесь, когда попытаетесь следовать любому руководству по использованию Kafka. Итак, давайте посмотрим ... Что такое тема в Apache Kafka? Сообщения в Kafka организованы по темам. Тема - это именованный логический канал между производителем и потребителями сообщений. Имя обычно используется для описания данных, содержащихся в теме. Примером темы может быть тема, содержащая показания всех..

Панель управления в реальном времени с Kafka и Spark Streaming
В настоящее время почти каждый разработчик или инженер, ориентированный на данные, или как они там себя называют, говорит о реальном времени, реальном времени и реальном времени ... Большую часть времени я работаю с пакетной обработкой, такой как Hadoop, Hive, Spark и т. Д. Но что, если вам нужно создать информационные панели в реальном времени? Вероятно, наиболее частый ответ: та-да! Apache Kafka и Apache Spark Streaming Но почему мы используем Spark Streaming? Apache Spark..

Apache Kafka для новичков
Эта статья посвящена введению в Apache Kafka и содержит инструкции по установке и настройке Apache Kafka в среде Windows, а также созданию потребителей и производителей Kafka. Apache Kafka и ключевые термины Apache Kafka - это распределенная потоковая платформа , которая позволяет отправлять и подписываться на поток данных. Apache Kafka быстрый, масштабируемый, надежный и отказоустойчивый. Кроме того, он может управлять большими объемами данных и может использоваться для..

Kafka Acks объяснил
Визуализация наиболее непонятого параметра конфигурации Kafka Проработав с Kafka почти два года, есть две конфигурации, взаимодействие которых, как я заметил, повсеместно запутано. Эти две конфигурации acks и min.insync.replicas - и как они взаимодействуют друг с другом. Эта статья призвана быть удобной справочной информацией, которая устраняет путаницу с помощью некоторых иллюстраций. Репликация Чтобы лучше понять эти конфигурации, полезно напомнить себе о протоколе..

Вопросы по теме 'apache-kafka'

ClassCastException: kafka.message.Message не может быть приведен к java.lang.String на kafka Producer
Я пытаюсь написать какой-нибудь простой производитель, который пишет сообщения в kafka. Я скачал kafka0.7. Запустите сервер kafka, производителя и потребителя > bin/kafka-server-start.sh config/server.properties >...
9360 просмотров
schedule 11.08.2022

Кафка PointToPoint
Проблема У нас есть установка ActiveMQ с несколькими центрами обработки данных, с NFS для каждой пары HA, и кажется, что activeMQ на самом деле не масштабируется и плохо справляется с проблемами NFS. (мы используем 5.7) Возможное решение...
4527 просмотров
schedule 07.06.2022

Класс разделителя KafKa, назначьте сообщение разделу внутри темы с помощью ключа
Я новичок в kafka, поэтому извиняюсь, если я звучу глупо, но до сих пор я понял ... Поток сообщений можно определить как тему, например категорию. И каждая тема разделена на один или несколько разделов (каждый раздел может иметь несколько реплик)....
35100 просмотров
schedule 22.09.2022

Kafka: невозможно создать несколько потребителей потока
Я только что начал работать с Kafka 0.8 beta 1. У меня есть действительно простой пример, проблема в том, что я могу заставить работать только одного потребителя сообщений, а не несколько. То есть метод runSingleWorker() РАБОТАЕТ. Метод run() НЕ...
4530 просмотров
schedule 08.12.2022

Можно ли назначить потребителя высокого уровня Kafka определенному разделу?
Учитывая тот факт, что Consumer в Kafka может быть настроен на получение сообщений только из одного раздела, я не видел подходов к настройке для этого. Как мне сказать брокеру Kafka: Что я ПОТРЕБИТЕЛЬ A с этим идентификатором в этой ГРУППЕ...
3142 просмотров
schedule 30.07.2023

Кафка добавляет префикс к сообщению
Работая с kafka 7.2 , при отправке сообщения с использованием производителя я обнаружил, что после его использования сообщение приходит с дополнительным разделом в начале сообщения. Например, при отправке в kafka простой строки «King Daniel»,...
907 просмотров
schedule 14.07.2023

Как я могу отправлять большие сообщения с Kafka (более 15 МБ)?
Я отправляю String-сообщения в Kafka V. 0.8 с помощью Java Producer API. Если размер сообщения составляет около 15 МБ, я получаю MessageSizeTooLargeException . Я попытался установить message.max.bytes to 40 МБ, но все равно получаю исключение....
174145 просмотров
schedule 03.10.2023

Сборка apache Kafka
Я пытаюсь построить Kafka с помощью Scala 2.10.1. Я попробовал выполнить шаги, указанные на Git-hub. В конце он генерирует Jar в каталоге Target, однако этот Jar пуст и его размер составляет 5 КБ. Я что-то упустил? Я совершенно новичок в SBT....
1748 просмотров
schedule 10.03.2023

UnsatisfiedLinkError при отправке сжатого (мгновенного) сообщения в kafka
В своем веб-приложении на Java я отправляю сообщения на адрес kafka . Я хотел бы сжать свои сообщения перед их отправкой, поэтому я устанавливаю в свойствах производителя: props.put ("сжатие.кодек", "2"); Насколько я понимаю, «2» означает...
3938 просмотров
schedule 10.07.2023

Ошибка создания темы Kafka в Windows 7
После нескольких повторных попыток и изменения файлов bat мне, наконец, удалось запустить Kafka и Zookeeper в Windows 7. Это 32-разрядная машина с Java 7. К сожалению, я не могу создать тему. Я пробовал использовать руководство здесь:...
8390 просмотров
schedule 26.06.2023

В Kafka как получить точное смещение по времени изготовления
Мне нужно, чтобы сообщение создавалось в Кафке час за часом в день. Каждый час я буду запускать задание по потреблению сообщения, созданного час назад. например, если текущее время 20:12, я буду использовать сообщение между 19:00:00 и 19:59:59. Это...
25558 просмотров
schedule 14.08.2022

Что означает исключение kafka.common.OffsetOutOfRangeException
Я пытаюсь загрузить данные через Apache Kafka и постоянно получаю эту ошибку: kafka.common.OffsetOutOfRangeException: смещение 1003786 вне допустимого диапазона в kafka.log.Log $ .findRange (Log.scala: 46) в kafka.log.Log.read (Log.scala: 264)...
10052 просмотров
schedule 13.07.2022

Hbase против Cassandra против Kafka для хранения данных временных рядов с высоким разрешением
Между Hbase, Cassandra и Kafka, каковы плюсы и минусы использования любой из технологий для хранения данных временных рядов с высоким разрешением (s или даже ms)?
5773 просмотров
schedule 20.02.2022

Какой синтаксис используется для описания структуры данных Kafka в ZooKeeper?
Я новичок в Kafka/Zookeeper, и меня немного смутил синтаксис, который используется для описания структуры данных Kafka в Zookeeper. Например: Schema: { "fields" : [ {"name": "version", "type": "int", "doc": "version id"}, {"name":...
529 просмотров
schedule 24.04.2023

Несколько производителей Kafka пишут в одну и ту же тему - порядок сообщений и пакетов данных
Я пытаюсь узнать о Кафке. Скажем, у меня есть несколько продюсеров, каждый из которых пишет в одну и ту же тему. (Не может быть больше тем из-за дизайна, и мы используем avro для сериализации) Поскольку наше сообщение слишком большое, нам нужно...
6967 просмотров
schedule 09.12.2022

Стратегии отказоустойчивости Zooker
Мы молодая команда, создающая приложение с использованием Storm и Kafka. У нас есть общий ансамбль Zookeeper из 3 узлов, который используется как Storm, так и Kafka. Я написал тестовый пример для проверки отказоустойчивости zooker 1) Убедитесь,...
2423 просмотров

WebSocket закрывается после 1000 сообщений
Я пишу приложение для потоковой передачи сообщений в браузер из Apache Kafka с использованием WebSocket. Когда сервер какое-то время не использует сообщения и смещение отстает, веб-сокет закрывается после 1000 или 2000 сообщений. Число, кажется,...
1176 просмотров

Проблема с потоковой передачей Spark Kafka
Я использую maven я добавил следующие зависимости <dependency> <!-- Spark dependency --> <groupId>org.apache.spark</groupId> <artifactId>spark-streaming_2.10</artifactId>...
6269 просмотров
schedule 27.04.2023

Кафка высокого уровня против потребителя низкого уровня
У меня есть следующие вопросы по темам и разделам 1) В чем разница между n-темами с m-разделами и n m темами? Будет ли разница при доступе к m-разделам через m потоков и n m тем с использованием n*m разных процессов 2) Идеальный вариант...
6785 просмотров
schedule 13.04.2023

Может ли уплотнение Kafka перезаписывать сообщения с тем же ключом раздела?
Я использую следующий код для записи в Kafka: String partitionKey = "" + System.currentTimeMillis(); KeyedMessage<String, String> data = new KeyedMessage<String, String>(topic, partitionKey, payload); И мы используем версию Kafka...
5172 просмотров
schedule 28.05.2022