Наборы данных для Apache Mahout

Я ищу наборы данных, которые можно использовать для реализации варианта использования системы рекомендаций Apache Mahout. Мне известны только наборы данных MovieLens из группа GroupLens Research.

Кто-нибудь знает какие-либо другие наборы данных, которые можно использовать для реализации системы рекомендаций? Меня особенно интересуют наборы данных на основе элементов, хотя другие наборы данных приветствуются.


person Harsha Hulageri    schedule 16.08.2010    source источник


Ответы (3)


это Себастьян из Mahout.

Доступен набор данных с чешского сайта знакомств, который может вас заинтересовать: http://www.occamslab.com/petricek/data/

Между прочим, термин «на основе элементов» относится к специальному подходу к совместной фильтрации, а не к самому набору данных, который обычно находится в общей форме трипелей пользовательского рейтинга элементов, с которыми работает большинство подходов к совместной фильтрации.

Мы хотели бы услышать о ваших результатах экспериментов и опыте (если вы хотите поделиться ими) в нашем списке рассылки пользователей по адресу [email protected].

person ssc    schedule 17.08.2010
comment
Спасибо, Себастьян. Когда закончу, обязательно поделюсь своими результатами. - person Harsha Hulageri; 24.08.2010

При поиске наборов данных я нашел несколько сайтов, на которых перечислены общедоступные наборы данных, которые можно использовать для интеллектуального анализа данных. Некоторые из них также можно использовать для Mahout.

Bixo Labs

Наборы данных UCI

KDnuggets

person Harsha Hulageri    schedule 23.08.2010

Вы можете посмотреть набор данных iPinYou RTB Bidding Data Quora: http://qr.ae/OrqgM http://contest.ipinyou.com/data-release.html

person user2120239    schedule 03.09.2014