Я слежу за этим блогом http://www.quuxlabs.com/blog/2010/09/matrix-factorization-a-simple-tutorial-and-implementation-in-python/ (также прикрепляя матрицу здесь) для оценки прогнозирование с использованием матричной факторизации. Изначально у нас есть разреженная матрица пользователя-фильма R.
Затем мы применяем алгоритм MF, чтобы создать новую матрицу R ', которая является произведением двух матриц P (UxK) и Q (DxK). Затем мы «минимизируем» ошибку в значении, указанном в R и R '. Пока все хорошо. Но на последнем этапе, когда матрица заполняется, я не настолько уверен, что это прогнозируемые значения, которые даст пользователь. Вот итоговая матрица:
На чем основано обоснование того, что это на самом деле «прогнозируемые» рейтинги. Кроме того, я планирую использовать матрицу P (UxK) в качестве скрытых функций пользователя. Можем ли мы как-то «оправдать», что это скрытые особенности пользователя?