Я хочу использовать Apache Mahout в качестве механизма рекомендаций; но здесь я обнаружил, что это вынуждает нас использовать свою собственную таблицу с именем delicious_preferences только с 3-4 столбцами и типом данных как число (длинный/большой int). Обязательно ли использовать эту таблицу и хранить данные только в числовом формате.
Apache Mahout как система рекомендаций
Ответы (1)
Это один из способов создания механизма рекомендаций, но есть и более простые способы.
Существует небольшая книга, доступная бесплатно от
http://www.mapr.com/practical-machine-learning
в котором объясняется способ развертывания рекомендательных систем поверх поисковой системы. Это требует автономного анализа для создания данных, которые вводятся в поисковую систему, но как только у вас есть данные индикатора в поисковой системе, вы можете давать рекомендации, используя поисковые запросы. Эти запросы не являются текстовыми запросами, а вместо этого используют прошлое поведение в качестве запроса.
Вы также можете увидеть слайды с описанием подхода здесь:
http://www.slideshare.net/tdunning/building-multimodal-recommendation-engines-using-search-engines
и тут:
http://www.slideshare.net/tdunning/using-mahout-and-a-search-engine-for-recommendation
Книгу легче понять, чем слайды без повествования, но оба они, вероятно, полезны, поскольку на слайдах больше деталей.