В R я пытаюсь найти минимальное значение для столбца, содержащего символьные типы данных. Большинство значений столбца - это фактически числа, но некоторые значения - это только строка «Недоступно».Сортировка столбца, содержащего строковые значения «Недоступные» в R
Я просто использовал это, чтобы получить значения.
minRate <- min(myRows[,columnIndex], na.rm = TRUE)
Это похоже на работу для большинства моих тестов. Однако, поскольку значения являются строками, значения типа «10.3» сортируются ниже значений, таких как «8.6», потому что «10.6» предшествует «8.6» в алфавитном порядке.
Затем я добавил «as.numeric» к смеси следующим образом:
minRate <- min(as.numeric(myRows[,columnIndex]), na.rm = TRUE)
Однако, теперь я получаю предупреждение о том, «Nas, введенном путем принуждения». Кроме того, в качестве ответа возвращается «NA», а не фактическое (неправильное) числовое значение.
Есть ли способ удалить значения «Недоступные» и получить реальное минимальное значение из этого столбца?
Использовать 'na.strings =" Недоступно "' 'в' read.csv/read.table' при чтении данных, и вам не нужно преобразовывать на 'numeric'. Что касается проблемы, о которой вы упомянули, может быть, что столбец является классом «фактор». Таким образом, преобразование в числовые числа с целым типом – akrun
@akrun - добавьте это в качестве ответа. Это помогло. – WEFX
Спасибо, я отправил комментарий как решение – akrun