2015-10-27 2 views
-1

У меня есть множество несбалансированных наборов данных, и я балансирую их с такими алгоритмами, как SMOTE и т. Д. все данные являются регрессионными данными. для сравнения данных до и после, мне нужно рассчитать коэффициент дисбаланса данных регрессии.коэффициент дисбаланса в R?

Я много искал, но напрасно. Я работаю на языке R.

как мы можем рассчитать коэффициент дисбаланса данных регрессии, заданный в языке R? не ИК (отношение дисбаланса) двоичных = данные нет экземпляров класса большинства/нет экземпляров класса меньшинства

+1

вам нужно дать какое-то указатель (например, описание или URL) на то, как отношение дисбаланса вычисляется. Большинство читателей здесь, включая меня, не поймут, о чем вы говорите. Вы пробовали библиотеку («sos»); findFn ("дисбаланс") '? –

ответ

1

Если предположить, что проблема является бинарной классификацией один и набора данных df имеет столбец с именем Class, вы можете использовать функцию как это рассчитать соотношение дисбаланса:

getIMR <- function(df){ 
    minCl <- names(which.min(table(df$Class))) 
    sum(df$Class!=minCl)/sum(df$Class==minCl) 
} 

Обратите внимание, что я предположил, что определение соотношения дисбаланса в N_majority/N_minority

+0

спасибо! У меня есть двоичные данные, а также данные с 5 классами, а также данные регрессии. Каково ваше мнение о соотношении дисбаланса регрессионных данных? –

+0

@AsaadGhufran: Это будет зависеть от того, как вы хотите их определить. Я не знаю стандартного представления для данных с несколькими классами и регрессией – jMathew

Смежные вопросы