все.Создание массива подмножества
Короче говоря:
У меня есть набор данных с более чем 60000 записей.
Одна переменная основана на том, где находится человек (местоположение), с примерно 10 различными категориями. Другим является общая удовлетворенность, из оценки от 1 до 10.
Однако все категории содержат либо слово Rural, либо слово Urban.
Что я хотел бы сделать, это сравнить общее среднее всех случаев, содержащих слово Rural в переменной местоположения, и все случаи, которые содержат слово Urban в переменной местоположения.
Я использовал обход, чтобы просто создать дополнительный столбец в исходном наборе данных в Excel, который находит слово Rural или Urban в столбце location и возвращает либо Rural, либо Urban в зависимости от того, что найдено, но я Конечно, должен быть способ сделать это строго, используя R.
Возможно ли это? Спасибо!
, пожалуйста, предоставьте воспроизводимый пример –