2016-11-10 6 views
-1

Допустим, вы являетесь юниором легкой атлетики, специализирующимся на 100 м. У меня есть рейтинг 400 младших игроков за каждый отдельный год с 2006 года по 2016 год (каждый год - отдельный CSV-файл (таблица))Спортсмен с статистической точки зрения

И у меня есть рейтинг старших игроков за каждый отдельный год с 2006 года по 2016 год (каждый год является отдельным CSV-файлом (таблица))

Вопрос, на который я хочу ответить: есть ли соотношение между хорошим спортсменом и вашими шансами стать звездой мира?

Итак, как мне подойти к этой проблеме. У меня есть хорошие навыки в Р. Просто укажите мне направление.

+0

Вы пытаетесь построить модель регрессии? В любом случае этот вопрос выходит за рамки SO и скоро будет закрыт. Взгляните на [эту ссылку] (http://stackoverflow.com/help/how-to-ask) – Sotos

+1

Как вы описали свою проблему, у вас нет данных, связывающих младших и старших спортсменов, поэтому я не как вы можете построить модель на основе этих данных. Или эти атлеты пересекаются? –

+0

Это мой вопрос, спортсмены накладываются друг на друга. Они растут через пару лет, и они начинают соревноваться в соревнованиях пожилых людей. Как я должен заниматься этим в R? Мне нужна небольшая помощь в построении модели. – Nemo

ответ

0

Есть ли связь между хорошим спортсменом и вашими шансами стать звездой мира?

Является ли звезда мира равной появлению во второй группе csv`s?

Быть в первой группе доказательств csvs быть хорошим спортсменом-младшим?

Будете ли вы предполагать, что каждое имя уникально и что имена не имеют шансов со временем?

Возможно, вы захотите построить таблицу, аналогичную таковой в тесте McNemar.

  Name in top athlethes 
       yes | no 
       +------+------- 
    top yes | 150 | 250 
junior no | 250 | 550 

Прямо сейчас, я не вижу причин, почему бы не вычислить отношение шансов того, чтобы ответить на ваш вопрос.

Все, что вам нужно сделать, это rbind all junior-CSV и unique имена, сделать то же самое с top-CSV и объединить эти два в качестве внутреннего соединения, чтобы найти перекрывающиеся имена. Соединения могут быть выполнены с использованием merge.

+0

Это идеальный ответ, который я искал. Спасибо! – Nemo