Как посчитать похожие интересы в MySQL

У меня есть 2 таблицы: «интересы» и «пользователи_интересы».

'users_interests' имеет только поля userid и interestid. 'interests просто имеет id и name.

Мне просто нужно найти идентификатор пользователя, который имеет более 3 общих идентификаторов интересов. Мне сказали, что задействовано Self Join, но я не могу заставить это работать.

Кто-то сказал, что что-то вроде этого может работать:

SELECT 
      others.userid 
  FROM interests AS user 
  JOIN interests AS others 
      USING(interestid) 
  WHERE user.userid = 2 
  GROUP BY 
      others.userid 
  ORDER BY COUNT(*) DESC

Но мне с этим не везет.


person Ryan    schedule 14.08.2010    source источник


Ответы (2)


SELECT ui.userid, COUNT(*) AS common_interests
FROM users_interests ui
WHERE ui.interestid IN (
    SELECT ui2.interestid FROM users_interests ui2 WHERE ui2.userid = 2
) 
AND ui.userid <> 2
GROUP BY ui.userid
HAVING common_interests > 3;

Обратите внимание на появление userid, по которому мы основываем наш поиск (2), в двух местах кода.

person Simen Echholt    schedule 14.08.2010

Вы сказали более 3 общих идентификаторов интересов, значит, вы имеете в виду «не менее 4», верно?

SELECT first1.userid, second1.userid
FROM users_interests first1, users_interests second1,
     users_interests first2, users_interests second2,
     users_interests first3, users_interests second3,
     users_interests first4, users_interests second4
WHERE
    first2.userid=first1.userid AND first3.userid=first1.userid AND first4.userid=first1.userid AND
    second2.userid=second1.userid AND second3.userid=second1.userid AND second4.userid=second1.userid AND
    first1.userid<>second1.userid AND
    first1.interestid=second1.interestid AND
    first2.interestid=second2.interestid AND first2.interestid<>first1.interestid AND
    first3.interestid=second3.interestid AND first3.interestid<>first2.interestid AND first3.interestid<>first1.interestid AND
    first4.interestid=second4.interestid AND first4.interestid<>first3.interestid AND first4.interestid<>first2.interestid AND first4.interestid<>first1.interestid

Поскольку я не проверял это, помните, что в нем могут быть ошибки, поэтому используйте его только в том случае, если вы его понимаете.

Если вам нужно то же самое для других общих интересов, я уверен, что вы можете написать код для динамической генерации этого запроса для любого числа. Кроме того, если вам нужны имена интересов, я уверен, что вы сможете добавить необходимые четыре объединения в таблицу interests и добавить соответствующие столбцы в предложение SELECT.

person Timwi    schedule 14.08.2010