Например, у меня есть набор данных для русских людей, как этотВходные данные libsvm?
userID 1 (or 2,3.....up to n)
gender male (or female)
working yes (or No)
income >$5000/month (or <$5000)
have_car yes (or no)
Я хочу, чтобы предсказать, что человек имеет автомобиль или нет базы на другие свойства (гендерный, рабочий и доход). Какой формат я должен использовать для обучения, и сколько людей я должен пройти обучение, сколько для тестирования, если допустим, что у меня есть данные из 10 000 человек.