2015-11-02 7 views
1

Я читал книгу Тома Митчелла о механизме Изучение части генетических алгоритмов классификации. Пример, который они ставят довольно просто, они говорят, что если у меня есть следующие:генетический алгоритм для классификации и оценки пригодности

enter image description here

тогда функция пригодности может быть определена как:

enter image description here

Я хотел бы применить этот подход для классификации данных о доходах от переписи, который имеет следующий вид:

39, State-gov, 77516, Bachelors, 13, Never-married, Adm-clerical, Not-in-family, White, Male, 2174, 0, 40, United-States, <=50K 
50, Self-emp-not-inc, 83311, Bachelors, 13, Married-civ-spouse, Exec-managerial, Husband, White, Male, 0, 0, 13, United-States, <=50K 
38, Private, 215646, HS-grad, 9, Divorced, Handlers-cleaners, Not-in-family, White, Male, 0, 0, 40, United-States, <=50K 
53, Private, 234721, 11th, 7, Married-civ-spouse, Handlers-cleaners, Husband, Black, Male, 0, 0, 40, United-States, <=50K 
28, Private, 338409, Bachelors, 13, Married-civ-spouse, Prof-specialty, Wife, Black, Female, 0, 0, 40, Cuba, <=50K 

В этом наборе атрибуты являются следующие:

age: continuous. 
workclass: Private, Self-emp-not-inc, Self-emp-inc, Federal-gov, Local-gov, State-gov, Without-pay, Never-worked. 
fnlwgt: continuous. 
education: Bachelors, Some-college, 11th, HS-grad, Prof-school, Assoc-acdm, Assoc-voc, 9th, 7th-8th, 12th, Masters, 1st-4th, 10th, Doctorate, 5th-6th, Preschool. 
education-num: continuous. 
marital-status: Married-civ-spouse, Divorced, Never-married, Separated, Widowed, Married-spouse-absent, Married-AF-spouse. 
occupation: Tech-support, Craft-repair, Other-service, Sales, Exec-managerial, Prof-specialty, Handlers-cleaners, Machine-op-inspct, Adm-clerical, Farming-fishing, Transport-moving, Priv-house-serv, Protective-serv, Armed-Forces. 
relationship: Wife, Own-child, Husband, Not-in-family, Other-relative, Unmarried. 
race: White, Asian-Pac-Islander, Amer-Indian-Eskimo, Other, Black. 
sex: Female, Male. 
capital-gain: continuous. 
capital-loss: continuous. 
hours-per-week: continuous. 
native-country 

В конце концов, что я хочу, чтобы иметь классификатор, который дал некоторые атрибуты могли бы предсказать, если доход человека будет меньше или больше 50000. Как мог Я моделирую функцию пригодности для этого случая?

ответ

0

Обычно для этой цели используется генетическое программирование. Вот статья, описывающая такой сценарий: http://web.cs.mun.ca/~banzhaf/papers/ieee_taec.pdf

Если вы ищете исходный код, вы можете использовать крошечные GP Риккардо Poli: http://cswww.essex.ac.uk/staff/rpoli/TinyGP/ Однако, в первую очередь вы должны преобразовать все атрибуты числовых значений.

Вы также можете использовать другие варианты GP. Я выполнил Программу множественного выражения, которая находится здесь: http://www.mepx.org/source_code.html

Смежные вопросы