Я пытаюсь использовать ALS, но в настоящее время мои данные ограничены информацией о том, что пользователь купил. Итак, я пытался заполнить ALS из Apache Spark с рейтингом, равным 1 (один), когда пользователь X купил элемент Y (и только такую информацию я предоставил этому алгоритму).
Я пытался изучить это (разделил данные для обучения/тестирования/проверки) или пытался просто изучить все данные, но в конце концов я получил прогноз с очень похожими значениями для любой пары пользователь-элемент (значения дифференцированы на 5-м или 6-м место после запятой вроде 0,86001 и 0,86002).
Я думал об этом, и, может быть, это потому, что я могу поставить только оценку, равную 1, поэтому ALS нельзя использовать в такой экстремальной ситуации?
Есть ли какой-то трюк с рейтингами, чтобы я мог решить эту проблему (у меня есть только информация о том, что было куплено - позже я собираюсь получить больше данных, но в данный момент я должен использовать какую-то совместную фильтрацию, пока я не приобрету больше данных - другими словами, мне нужно показать пользователю какую-то рекомендацию на стартовой странице. Я выбираю ALS для стартовой страницы, но, возможно, я использую что-то еще, что именно)?
Конечно, я менял такие параметры, как итерации, лямбда, ранг.