Я только начинаю работать с Hadoop и пытаюсь понять, как использовать другие источники ввода, не являющиеся файлами, т.е. читать все строки из AWS SimpleDB или все записи из REST API в другой системе. Все онлайн только показывает, как обрабатывать файлы или несколько выбранных баз данных.
API для InputFormat выглядит довольно сложным, поэтому я пытаюсь найти самый быстрый способ чтения данных из любого нефайлового источника данных, который затем можно обработать с помощью MapReduced с помощью Amazon Elastic MapReduce (на основе Hadoop). Я использую JAVA для написания кода.
Спасибо!