Я пытаюсь использовать Spark MLib ALS для совместной фильтрации музыкальных рекомендаций. Входные данные имеют несколько полей, включая userId, songId, artist и т. д. У меня нет поля рейтингов в моих данных. БАС нуждается в оценке как один из параметров. Я много оглядывался, но не мог получить никакой помощи. Как я могу продолжить это? Можно ли взять listen_count (количество раз, когда пользователь прослушал определенную песню)
Мой набор данных:
user_id song_id songtitle artist language music_director
123 1 abc artist1 English NULL
345 2 xyz artist2 English NULL
456 3 abc artist3 English NULL
567 4 xyz artist4 English NULL
678 5 xyz artist5 English NULL
789 6 abc artist6 English NULL