Я использую CreateML для создания модели Recommender с использованием неявного набора данных в формате: User ID, Item ID. Данные загружаются в CreateML как CSV, содержащий около 400 тыс. Строк.
При попытке «обучить» модель я получаю следующую ошибку:
Training Error: Item IDs in the recommender model must be numbered 0, 1, ..., num_items - 1
Мой набор данных имеет следующий формат:
"user_id","item_id"
"e7ca1b039bca4f81a33b21acc202df24","f7267c60-6185-11ea-b8dd-0657986dc989"
"1cd4285b19424a94b33ad6637ec1abb2","e643af62-6185-11ea-9d27-0657986dc989"
"1cd4285b19424a94b33ad6637ec1abb2","f2fd13ce-6185-11ea-b210-0657986dc989"
"1cd4285b19424a94b33ad6637ec1abb2","e95864ae-6185-11ea-a254-0657986dc989"
"31042cbfd30c42feb693569c7a2d3f0a","e513a2dc-6185-11ea-9b4c-0657986dc989"
"39e95dbb21854534958d53a0df33cbf2","f27f62c6-6185-11ea-b14c-0657986dc989"
"5c26ca2918264a6bbcffc37de5079f6f","ec080d6c-6185-11ea-a6ca-0657986dc989"
Я попытался изменить как Item ID, так и User ID на перечисленные идентификаторы, но все равно получаю ошибку обучения. Пример:
"item_ids","user_ids"
0,0
1,0
2,0
2,0
0,225
400,225
409,225
0,282
0,4
8,4
8,4
Я получаю эту ошибку как в пользовательском интерфейсе CreateML, так и при использовании CreateML на игровой площадке Swift. Я также попытался удалить дубликаты и убедился, что максимальный идентификатор для каждого столбца равен (num_items - 1).
Я безуспешно искал документацию о том, какие именно требования предъявляются к набору идентификаторов.
Заранее благодарим вас за любую помощь в прояснении этого сообщения об ошибке.