Программирование для поиска Z-счета в Apache Mahout и вычисления сходства

Я новичок в apache mahout. Мне удалось использовать его для корреляции Пирсона и вектора косинуса, но мне нужно нормализовать данные и использовать Z Score для вычисления сходства. Я не могу найти методы в mahout, которые позволяют это сделать. Вики mahout также не демонстрирует использование нормализации данных и использование для вычисления сходства. Я был бы очень благодарен, если бы кто-нибудь помог мне с кодом для того же самого.


person Umar Farooque    schedule 25.10.2014    source источник


Ответы (1)


На эти вопросы лучше ответить в списке рассылки пользователей mahout.

В любом случае, было бы неплохо понять, что вы пытаетесь сделать в более широком масштабе. Похоже, вы пытаетесь создать механизм рекомендаций. Если это так, корреляция Пирсона, как правило, очень плохой способ сделать это.

Гораздо лучше использовать Mahout для расчета поведения индикатора, а затем использовать поисковую систему, такую ​​как Solr или ElasticSearch, для развертывания функции рекомендаций.

Мы описали, как это сделать, в небольшой книге O'Reilly, которую вы можете получить:

https://www.mapr.com/practical-machine-learning

person Ted Dunning    schedule 26.10.2014