У меня есть блок данных корреляции между 45 переменными и добавил значение случайного значения леса, данное каждой функцией «varImp» (я запускал случайную модель обучения лечению с помощью эти данные.сравнить переменные и удалить один с наименьшим значением R
Я хотел бы пропустить каждый столбец и везде, где переменная имеет корреляцию по .8 (в абсолютном выражении), удалите либо эту переменную строки, либо эту переменную столбца, в зависимости от того, какая из них имеет более низкую переменную varImp, значение. Я также хотел бы удалить одну и ту же переменную из столбца/строки (поскольку это корреляционная матрица, все переменные отображаются как в строке, так и в столбце).
Например, roll_belt и max_picth_belt имеют корреляцию ~ .97, а поскольку roll_belt имеет значение 3,77 по сравнению с max_picth_belt 3.16, я хотел бы удалить max_pitch_belt как в строке, так и в виде столбца.
Спасибо за вашу помощь!
Звучит работа для «применения», но вы опубликовали бесполезную картинку. Не отправляйте 'dput' части ваших данных, а не изображение. – SabDeM
Пожалуйста, добавьте свои фактические данные и покажите нужный результат. –
Прошу прощения, вот документ google doc данных: https://docs.google.com/spreadsheets/d/1sT6M7hIQcTM_sh2YhkK_uZAq6ZjLksCvLtRhtQR19v8/edit?usp=sharing – user3711502