У меня есть 2 непрерывных переменных, каждый из которых имеет значения в диапазоне [0, 1]. Каждый из них может быть классифицирован как низкий ($ \ le 0.25 $), средний ($ 0.25 - 0.70 $) и высокий ($ \ ge 0.7 $). Мне нужно создать индекс, используя обе переменные, и использовать этот индекс в модели регрессии. Генерируются индекс будет согласно следующей таблице истинности:Как создать индекс, который будет использоваться в регрессии?
Var1/ Var2 | Low | Medium | High | ======================================= Low | Low | Low | Low | Medium | Low | Medium | Medium | High | Low | Medium | High | =======================================
прямо вперед умножение двух переменных не является решение в некоторых значениях даст выход Medium (var1 = 0,75 и var2 = 0,8, например).
В модели я хотел бы использовать индексное выражение (а не категориальное преобразование). Это сохранит изменение данных.
Что f (var1, var2) предоставит мне этот индекс, который будет использоваться в lm/R?
Помощь !!!
Таким образом, вы не хотите, чтобы индекс категоричны т.е. ' 'Low ',' Medium ',' High '', но, скорее, с учетом приведенной выше таблицы. Но вы не знаете, какой метод использовать для создания этого числового индекса? Я спрашиваю, потому что мне не очень понятно, что вы просите. – LyzandeR
Да, я ищу способ создания числового индекса. Как указано ниже, использование минимума var1 и var2 устраняет вариации в var1 или var2. Я хотел бы сохранить его и, возможно, использовать его в регрессии. – kishore
Можете ли вы привести пример? Что вам нравится в качестве вывода, если var1 = 0.1 и var2 = 0.2? Или вы можете объяснить, что хотите регрессировать? Возможно, это не самый простой способ. – Michiel