Например, у меня есть набор данных для n таких людей.
userID 1 (or 2,3.....up to n)
gender male (or female)
working yes (or No)
income >$5000/month (or <$5000)
have_car yes (or no)
Я хочу предсказать, есть у человека машина или нет, исходя из других свойств (пол, работа и доход). Какой формат я должен использовать для обучения, и сколько людей я должен поставить на обучение, сколько на тестирование, если, допустим, у меня есть данные о 10 000 человек.