Я новичок в apache mahout. Мне удалось использовать его для корреляции Пирсона и вектора косинуса, но мне нужно нормализовать данные и использовать Z Score для вычисления сходства. Я не могу найти методы в mahout, которые позволяют это сделать. Вики mahout также не демонстрирует использование нормализации данных и использование для вычисления сходства. Я был бы очень благодарен, если бы кто-нибудь помог мне с кодом для того же самого.
Программирование для поиска Z-счета в Apache Mahout и вычисления сходства
Ответы (1)
На эти вопросы лучше ответить в списке рассылки пользователей mahout.
В любом случае, было бы неплохо понять, что вы пытаетесь сделать в более широком масштабе. Похоже, вы пытаетесь создать механизм рекомендаций. Если это так, корреляция Пирсона, как правило, очень плохой способ сделать это.
Гораздо лучше использовать Mahout для расчета поведения индикатора, а затем использовать поисковую систему, такую как Solr или ElasticSearch, для развертывания функции рекомендаций.
Мы описали, как это сделать, в небольшой книге O'Reilly, которую вы можете получить:
https://www.mapr.com/practical-machine-learning
person
Ted Dunning
schedule
26.10.2014