Я хотел бы знать, что для меня лучше всего: поток Kafka или потребительский API Kafka или подключение Kafka?
Я хочу прочитать данные из темы, затем обработать и записать в базу данных. Итак, я написал потребителей, но я чувствую, что могу написать потоковое приложение Kafka и использовать его процессор с отслеживанием состояния для выполнения любых изменений и записи их в базу данных, которая может устранить мой потребительский код, и мне нужно только написать код db.
Базы данных, которые я хочу вставить в свои записи: HDFS - (вставить необработанный JSON) MSSQL - (обработанный json)
Другой вариант - подключение Kafka, но я обнаружил, что на данный момент нет поддержки json для приемника hdfs и соединителя приемника jdbc (я не хочу писать в avro), и создание схемы также является проблемой для сложных вложенных сообщений.
Или я должен написать собственный Kafka connect, чтобы сделать это.
Так нужно ли вам мнение о том, следует ли мне писать потребителя Kafka, поток Kafka или соединение Kafka? А что будет лучше по производительности и с меньшими накладными расходами?