Набор данных с более чем тремя значениями

Я планирую создать рекомендательную систему с помощью apache Mahout. Я искал в Интернете об этом. и я обнаружил, что он использует следующий формат для файла набора данных. идентификатор пользователя, идентификатор элемента, предпочтение

то, что я хочу использовать в качестве набора данных, имеет такую ​​структуру.

Идентификатор, рейтинг, местоположение, навыки, плата

Есть ли способ сделать это? Или я должен использовать Weka. Он предоставляет возможность создания пользовательского набора данных. но отзывы показывают, что это не лучший вариант по сравнению с mahout для системы рекомендаций.


person user3297557    schedule 08.06.2014    source источник


Ответы (2)


Планируете ли вы использовать совместную фильтрацию? Обычно с CF вы учитываете множество пользовательских предпочтений в отношении элементов. Затем для данного пользователя вы рекомендуете элементы. Похоже, у вас нет пользовательских настроек.

В любом случае вам нужно будет предварительно обработать ваши данные в требуемой форме, это все, что в любом случае будет использоваться в CF.

person pferrel    schedule 09.06.2014
comment
Я планирую гибридный подход. совместная и контентная. - person user3297557; 09.06.2014

Попробуйте понять этот пример:

https://github.com/apache/mahout/tree/master/examples/src/main/java/org/apache/mahout/cf/taste/example/bookcrossing

я надеюсь, что это поможет вам

person Goko Gorgiovski    schedule 16.07.2014