Добро пожаловать в StackOverflow и R. Сначала я хотел бы начать с:
> library(help = "datasets")
Это говорит вам немного о доступных наборов данных в этом пакете.
Этот пакет является частью базовой установки R, и вам не нужно его загружать. Если вам интересно, где эти данные хранятся на вашем компьютере, вы можете ввести:
> system.file("data",package = "datasets")
Для получения дополнительной информации о state
наборах данных, вы можете ввести: ?state
Это говорит о том, что state.division
является один из наборов данных, доступных в этом пакете.
> str(state.division)
Однако, он не будет делать много смысла без какого-либо дополнительного контекста, поэтому попробовать что-то вроде:
> head(df <- data.frame(state.abb, state.division, state.x77))
state.abb state.division Population Income Illiteracy Life.Exp Murder HS.Grad
Alabama AL East South Central 3615 3624 2.1 69.05 15.1 41.3
Alaska AK Pacific 365 6315 1.5 69.31 11.3 66.7
Arizona AZ Mountain 2212 4530 1.8 70.55 7.8 58.1
Arkansas AR West South Central 2110 3378 1.9 70.66 10.1 39.9
California CA Pacific 21198 5114 1.1 71.71 10.3 62.6
Colorado CO Mountain 2541 4884 0.7 72.06 6.8 63.9
Frost Area
Alabama 20 50708
Alaska 152 566432
Arizona 15 113417
Arkansas 65 51945
California 20 156361
Colorado 166 103766
С в data.frame
вы должны иметь контекст, что вам нужно, чтобы начать делать интересные сюжеты или моделей, например модель линейной регрессии:
summary(lm(Murder ~ state.division + Illiteracy, data=df, weights=Population))