У меня есть данные, что выглядит этойNumpy, сортировка на основе столбца дважды
[[361 2 2]
[259 4 3]
[ 361 6 5]
[ 259 8 5]
...
]
В исходных данных, то первый столбец люди идентификатор, второй столбец тест идентификатор и третий знак (к примеру).
Я хочу, чтобы создать Numpy массив, который сортирует как этот
[
[score_for_test_id_0_for_person_0, score_for_test_id_1_for_person_0, score_for_test_id_2_for_person_0 ],
[score_for_test_id_0_for_person_1, score_for_test_id_1_for_person_1, score_for_test_id_2_for_person_1 ]
]
Длина new_array будет количество людей. Каждый элемент нового массива будет таким, как [score_for_test_id_0, score_for_test_id_1, score_for_test_id_n]
Я бы знал, как это сделать в обычном Python, но это будет полностью неэффективно, я не уверен, как это сделать в Numpy, хотя ,
Я предлагаю вам взглянуть на [панда] (http://pandas.pydata.org/) – BrenBarn
Я смущен о вашем выходе. Можете ли вы описать (на словах), как вы пришли к этому результату? – mgilson
Итак, каждая строка нового массива представляет человека, и внутри каждой строки находятся оценки для каждого из их тестов, отсортированных из теста ids от самого маленького до наибольшего [оценка для теста 0, оценка для теста 1, оценка для теста 2, .. ect.] Пожалуйста, дайте мне знать, если возникнут вопросы –