Скажем, мои данные выглядит следующим образом:Панды - Создание нескольких столбцов похож на pd.get_dummies
df = pd.DataFrame({'color': ['red', 'blue', 'green', 'red', 'blue', 'blue'], 'line': ['sunday', 'sunday', 'monday', 'monday', 'monday', 'tuesday'],
'group': ['1', '1', '2', '1', '1', '1'], 'value': ['a', 'b', 'a', 'c', 'a', 'b']})
color group line value
0 red 1 sunday a
1 blue 1 sunday b
2 green 2 monday a
3 red 1 monday c
4 blue 1 monday a
5 blue 1 tuesday b
По сути, то, что я хочу, чтобы получить список строк для каждого цвета. Например, я хочу, чтобы цвет красный отображал каждую строку и значение, связанные с ним, в своем столбце. Фокус в том, что я также хочу показать другие строки, связанные с цветами из той же группы. Соответствующие значения для них будут «недопустимы». Таким образом, я хочу, чтобы мой выход выглядеть следующим образом:
color line_1 line_1_value line_2 line_2_value line_3 line_3_value
0 red sunday a monday c tuesday not eligible
1 blue sunday b monday a tuesday b
2 green monday c
Есть некоторые ~ 50000 уникальных «цвета», что мне нужно сделать это для. Я уверен, что это нечто относительно простое, но у меня пока нет знаний или навыков, чтобы понять это. Любая помощь будет оценена!
Это кло se к тому, что я ищу; однако он не учитывает линии, которые связаны с другим цветом в группе. Таким образом, Line_2 для «красного цвета» должен показывать вторник, а соответствующее значение должно показывать «не подходит» – tbg0001
. В качестве первого шага измените ваш фреймворк, добавив «не подходящий» в столбец значений для каждой группы, затем отбросьте группу и перейдите по алгоритму выше , Основная идея заключается в том, чтобы подготовить ваш фреймворк со всем, что вам нужно, перед тем, как применить опорный стержень. Вы видите здесь логику? – Boud
Мне удалось выяснить, как добавить дополнительные записи в конец моего фрейма. Все это было включено в одну функцию для будущих целей. Спасибо за вашу помощь! – tbg0001