Я отправил вопрос на обмен стеками статистики, но, к сожалению, не получил ответа до сих пор, поэтому я клонирую его здесь и надеюсь, что кто-то может помочь.
Я новичок в машинном обучении. Недавно я попытался узнать что-то об этом и получил следующее беспокойство:
У меня есть продукты, классифицированные по категориям. Также у меня есть пользователи с информацией о поле и модели устройства.
Во-первых, я сделал тест хи-квадрат, чтобы проверить, связаны ли категории и информация о поле + устройстве. Например, мое значение p равно 0,000012, поэтому я заявил, что пользователь (пол + устройство) связан с категориями.
Итак, если новый пользователь пришел со своим полом (женский) + устройство (iPhone):
Как результат теста хи-квадрат, должна быть связь между полом + устройством и категориями. Поэтому я выбираю 10 лучших категорий, которые потребляют женщины, использующие iPhone. У меня есть список, например. [1. Мода, 2. Мобильные устройства, 3. Фотокамеры, 4. Мебель для дома, 5. Велосипеды и т. д.]
Я также делаю z-тест по категориям (без какой-либо информации о пользователе) и получаю список (более высокий z-показатель будет сверху), например. [1. Мобильные устройства, 2. Велосипеды, 3. Мода, 4. Ноутбуки и т. д.]
Итак, в этом случае, какой список я должен дать этому пользователю? Или есть возможность их комбинировать? Или я что-то не так сделал?
Заранее спасибо :-)