Я использую новую экспериментальную очередь задач для java appengine и пытаюсь создать задачи, которые собирают статистику в моем хранилище данных. Я пытаюсь подсчитать количество УНИКАЛЬНЫХ значений во всех сущностях (определенного типа) в моем хранилище данных. Более конкретно, скажем, объект типа X имеет поле A. Я хочу подсчитать ЧИСЛО уникальных значений A в моем хранилище данных.
Мой текущий подход заключается в создании задачи, которая запрашивает первые 10 объектов типа X, создавая хэш-таблицу для хранения уникальных значений A, а затем передавая эту хэш-таблицу следующей задаче в качестве полезной нагрузки. Эта следующая задача будет подсчитывать следующие 10 объектов и так далее, и так далее, пока я не пройду через все объекты. Во время выполнения последней задачи я подсчитаю количество ключей в моей хеш-таблице (которая все время передавалась от задачи к задаче), чтобы найти общее количество уникальных значений A.
Это работает для небольшого количества сущностей в моем хранилище данных. Но я беспокоюсь, что эта хеш-таблица станет слишком большой, когда у меня будет много уникальных значений. Каков максимально допустимый размер полезной нагрузки задачи appengine?????
Можете ли вы предложить какие-либо альтернативные подходы?
Спасибо.