У меня есть 25-20 агентов, отправляющих данные паре агентов-сборщиков, и эти агенты-сборщики затем должны записывать их в HDFS.
Куда запустить этих коллекторских агентов? На узле данных кластера Hadoop или вне кластера? Каковы плюсы/минусы каждого и как люди в настоящее время используют их?