Я хочу хранить большое количество точек данных для действий пользователя, таких как лайки, теги и т. д. (у меня есть планы как для электронной коммерции, так и для управления документами).
С точками данных я хочу поддерживать такие функции, как
- рекомендации «пользователи, которые любили X, любили Y, Z»
- Кластеризация «получить больше вещей, похожих на X, Y».
Готов к производству, в режиме реального времени; Я имею в виду, что я могу вводить точки данных и делать запросы одновременно, сервер сам позаботится об ответах на запросы и обновлении оценок.
Я искал в Интернете, и решения, которые появляются, являются одним из:
- Библиотеки интеллектуального анализа данных, которые в основном ориентированы на академические науки и предназначены для больших пакетных операций, не для тяжелых запросов в реальном времени
- Hadoop/Mahout, готовый к работе и поддерживающий обновления и запросы в режиме реального времени, но требующий сложного обучения и сложный в администрировании.