Чем отличаются совместная фильтрация и тематическое моделирование и чем они похожи?

связанные с: Простая реализация Python для совместного тематического моделирования?

Я пытаюсь понять фундаментальные различия и основные части, которые одинаковы в collaborative-filtering и topic-modeling. И то, и другое кажется мне очень похожим: пытаетесь найти скрытое измерение, которое может компактно предсказать, какой пользователь выберет тот или иной фильм или какой документ будет содержать какое слово?

Можете ли вы пролить свет или послать меня к источникам, которые прояснят это?

Спасибо!


person ihadanny    schedule 26.12.2016    source источник


Ответы (1)


Я думаю, что эта бумага - ваш лучший выбор:

https://www.cs.princeton.edu/~blei/papers/WangBlei2011.pdf

В нем говорится о сочетании совместной фильтрации и тематического моделирования (две действительно разные вещи). Возможно, есть некоторое сходство, если вы посмотрите особенно на probabilistic matrix factorization for collaborative filtering и probabilistic topic modeling, в том, как генерируются решения, но это все же довольно ограничено.

Из вашего вопроса неясно, интересует ли вас topic modeling или collaborative topic modeling. Тем не менее, упомянутая мной статья дает некоторые сведения о совместной фильтрации (путем матричной факторизации), некоторые сведения о вероятностном тематическом моделировании, а затем:

СОВМЕСТНАЯ ТЕМАТИЧЕСКАЯ РЕГРЕССИЯ (CTR), CTR сочетает в себе традиционную традиционную совместную фильтрацию с тематическим моделированием.

Только что понял, что эта статья уже упоминается в вопросе, на который вы ссылаетесь, поэтому позвольте мне поделиться еще одним замечательным ресурсом, этой статьей в NYT, которая менее насыщена математикой.

http://open.blogs.nytimes.com/2015/08/11/building-the-next-new-york-times-recommendation-engine/

Где описывают, как на самом деле реализовали подход из упомянутой выше статьи.

Наоборот, для более подробной информации о моделировании тем я бы предложил изучить ресурсы на этой странице:

https://www.cs.princeton.edu/~blei/topicmodeling.html< /а>

и эта статья для матричной факторизации для совместной фильтрации:

https://datajobs.com/data-science-repo/Recommender-Systems-%5BNetflix%5D.pdf

person yoh.lej    schedule 06.01.2017