Я пишу код, где мне нужно проверить, равны ли все размеры групп для заданного ввода данных. Например, предположим, что я хотел бы знать, имеет ли «миль на галлон» набора данных (в пакете ggplot2):Как проверить, имеет ли данные одинаковое количество наблюдений на группу?
- Равное количество автомобилей для каждого производителя
- Равное количество автомобилей для каждого типа привода (4- колесо, передний, задний)
- Равное число автомобилей для каждого типа двигателя (4-цилиндровый, 6-цилиндровый, 8-цилиндровых)
Для получения данных, таких как миль на галлон, некоторые из этих вопросов может получить ответ, проверив итоговый результат
library(ggplot2) # contains the mpg dataset
summary(mpg$drive) # shows the breakdown of cars by drive-type,
# which we can verify is unequal
Но я чувствую, что мне не хватает простого способа проверить, являются ли групповые размеры равными. Есть ли какая-то одна мифическая функция, которую я могу назвать как are.groups.of.equal.size(x)
? Или другая базовая функция (или их состав), которая вернет такую информацию?
'table'? 'Aggregate'? 'Ddply'? Soooooo много способов сделать это. – joran
@joran - Я пытаюсь автоматизировать его, поэтому решение будет в основном возвращать логическое значение относительно того, равны ли размеры группы или нет. Как я могу использовать 'table',' aggregate' или 'ddply' для этого? – briandk
table() возвращает вектор. Просто проверьте, равны ли все элементы этого вектора. sd() будет одним быстрым способом сделать это. –