У меня есть несколько годовых футбольных данных, которые я бы хотел проверить, чтобы проверить, могут ли определенные показатели команды повторяться в следующем году. Мои данные в data.frame и выглядит примерно так:Scatterplot of Year-on-Year Корреляция данных в R с использованием ggplot2
y2003 y2004 y2005
Team 1 51.95455 51.00000 53.59091
Team 2 54.18182 56.31818 49.09091
Team 3 48.68182 46.86364 49.22727
Team 4 50.86364 47.68182 48.72727
То, что я хочу быть в состоянии сделать это с этого рассеивания «Год п» на оси х, а «Год п + 1» на ось y. Так, например, 2003 против 2004, 2004 против 2005, 2005 против 2006 и т. Д. Все на одном и том же участке.
Я хотел бы, чтобы иметь возможность нарисовать линию наилучшим образом, чтобы увидеть, насколько сильна корреляция, является ли она повторяемой или нет.
Каков наилучший способ сделать это в R с помощью ggplot2? Я могу получить начальный участок с:
p=ggplot(df,aes(y2003,y2004))
p + geom_point()
Тогда мне просто нужно добавить их все вручную? Есть ли встроенная функция для такого рода вещей? И если я добавлю их все один за другим, как мне лучше всего подойдет?