У меня есть список предметов и количество раз, когда они были куплены. Большинство из этих предметов являются частью нескольких категорий. Некоторые относятся к одной категории, другие — к двум, некоторые — к более чем двум.
Теперь я хотел бы составить рейтинг по каждой категории, показывающий наиболее конвертированные элементы, независимо от того, присутствует ли один элемент в нескольких категориях. Это прекрасно.
Категории в одной строке разделены строкой >
.
ItemId Category PCC
5063660193 Go to Gifts 2
24154563660193 Go to Gifts>All Gifts 1
Я хотел бы, чтобы это стало:
ItemId Category PCC
5063660193 Go to Gifts 2
24154563660193 Go to Gifts 1
24154563660193 All Gifts 1
Тогда останется только ранжировать их с помощью функции rank() over()
в SQL. Если это невозможно в SQL, я могу использовать R. Возможно, в этом случае может пригодиться функция reshape
.