2015-04-15 3 views
0

Am новое машинного обучения, но, Am пытается построить модель прогнозирования, все мои тренировки набор переменных категоричны,модель прогнозирования здания с использованием категорических данных в R

PREDICTOR_1  PREDICTOR_2    PREDICTOR_3 
Found  : 5 Best Match :2  Found, Supplier site: 5 
No result : 2 Found  :8  Found, Zone site : 1 
Part NotFound:11 Not Found WDA:8  No Data Found  :12 
    PREDICTOR_4      PREDICTOR_5 PREDICTOR_6 
No result :11  Found with Different length: 1 High  :10  
Search begin: 7  No result     :16 LOW  : 4  
         Part Found With out Suffix : 1 No result: 4  
    PREDICTOR_7 PREDICTOR_8    PREDICTOR_9  RESULT 
Direct_Match: 8  NO  :8  Mpn Found within PCN: 3 Found :15 
No result :10  YES  :8  Mpn has no PCN  :15 Not Found: 3 
         YES-REMOVE:2 

Я пытался использовать GLM R в функции() , но я получаю

Warning message: 
glm.fit: fitted probabilities numerically 0 or 1 occurred 

1- Я хочу знать, если это возможно, использовать только категорические данные для обучения модели
эфир 2- Какой смысл этой ошибки

ответ

1

1 в модели glm можно использовать только категориальные данные

2 эта ошибка возникает, когда одна (или более) пояснительная переменная имеет корреляцию с переменной ответа, равной 1 или -1. Я предлагаю вам сначала удалить (с другими объясняющими переменными) и удалить такие объясняющие переменные, которые имеют корреляцию, равную 1 или -1 с переменной ответа. Это можно сделать с помощью функции cor в R. Я предлагаю коэффициент корреляции Кендаля для категориальных данных. Попробуйте cor(data, method = "kendall")

+0

Получение этой ошибки: Ошибка в cor (mydatafacotrize, method = "kendall"): 'x' должно быть числовым –

+0

Попробуйте: cor (as.numeric (mydatafacotrize), method = "kendall") ' –

Смежные вопросы