Я пытаюсь итеративно сортировать данные в столбцах, чтобы извлечь N максимальных значений.R - Максимальные значения сортировки и подстановки в столбцах
Мои данные настроены с первым и вторым столбцами, содержащими заголовки и коды занятости, и все остальные столбцы, содержащие сравнительные значения (в данном случае данные о местоположении, которые должны были быть предварительно рассчитаны для каждого города) для тех занятия для разных городов:
*occ_code city1 ... city300*
occ1 5 ... 7
occ2 20 ... 22
. . . .
. . . .
occ800 20 ... 25
для каждого города я хочу сортировать по максимальным значениям, выберите подмножество этих максимальных значений соответствующих их соответствующих профессий названий и названий. Я думал, что это будет относительно тривиально, но ...
Редактировать для уточнения: Я хочу закончить с отсортированным подмножеством данных для анализа.
occ_code city1
occ200 10
occ90 8
occ20 2
occ95 1.5
В то же время я хочу, чтобы иметь возможность повторить сортировку по столбцам (так я пробовал много порядка команды через вызов столбцов непосредственно: данные [2], просто чтобы быть в состоянии работать один и та же функция анализа за весь набор данных.
Я баловаться с plyr в течение последних 3-х дней, и я чувствую, как настройки моего набора данных просто не способствует тому, как должен был Plyer быть использован.
Не могли бы вы немного разъяснить вопрос? Это поможет нам привести пример с меньшим фреймом данных в качестве входных данных и примером вывода, который вы хотите извлечь. – chrisamiller
Да, сложно понять, что вы хотите здесь. – John
Сначала я хочу получить подмножество с двумя столбцами данных: список из 10 самых больших значений столбца «city1», соответствующий их соответствующим «оксовым кодам» (из первого столбца). Это было бы достаточно просто, чтобы сказать excel, только мне нужно будет повторить операцию 300 раз * 10 лет данных. – AzadA