У меня есть база данных со многими резюме, включая структурированные данные по полу, возрасту, адресу, количеству лет обучения и многим другим параметрам каждого человека.Выполнение прогнозов из резюме
Для примерно 10% образца у меня также есть дополнительные данные о определенном действии, которое они совершили в определенный момент времени. Например, Джейн взяла ипотечный кредит в июле 1998 года или что Джон начал подготовку пилотов в январе 2007 года и получил лицензию в декабре 2007 года.
Мне нужен алгоритм, который даст для каждого из действий вероятность того, что это произойдет для каждого человека в будущем. Например, вероятность того, что Билл возьмет ипотечный кредит, составит 2% в 2011 году, 3,5% в 2012 году и т. Д.
Как я должен подходить к этому? Регрессивный анализ? SVM? Нейронная сеть? Что-то другое?
Возможно ли даже какой-то стандартный инструмент/библиотека, который я могу использовать только с очевидными настройками?
Не пытайтесь делать это самостоятельно. Нанимайте кого-то с достойной статистической подготовкой. – 2010-09-18 21:25:05
Это называется алгоритмом Crystal Ball. –
Я полагаю, что это также во многом зависит от того, сколько записей у вас есть (и насколько они представлены), что вы действительно можете вывести полезные предсказания вообще. – Archimedix