Учитывая два ДФХ с не уникальными индексами и многомерных столбцов:Объединение нескольких dataframes с не уникальными индексами
Ars:
arsenal arsenal arsenal arsenal
NaN B3 SK BX BY
2015-04-15 NaN NaN NaN 26.0
2015-04-14 NaN NaN NaN NaN
2015-04-13 26.0 26.0 23.0 NaN
2015-04-13 22.0 21.0 19.0 NaN
Che:
chelsea chelsea chelsea chelsea
NaN B3 SK BX BY
2015-04-15 NaN NaN NaN 1.01
2015-04-14 1.02 NaN NaN NaN
2015-04-14 NaN 1.05 NaN NaN
здесь в формате CSV
,arsenal,arsenal,arsenal,arsenal
,B3,SK,BX,BY
2015-04-15,,,,26.0
2015-04-14,,,,
2015-04-13,26.0,26.0,23.0,
2015-04-13,22.0,21.0,19.0,
,chelsea,chelsea,chelsea,chelsea
,B3,SK,BX,BY
2015-04-15,,,,1.01
2015-04-14,1.02,,,
2015-04-14,,1.05,,
Я хотел бы объединить/объединить их, соединить внешнее соединение, чтобы строки не отбрасывались.
Я хотел бы выход быть:
arsenal arsenal arsenal arsenal chelsea chelsea chelsea chelsea
NaN B3 SK BX BY B3 SK BX BY
2015-04-15 NaN NaN NaN 26.0 NaN NaN NaN 1.01
2015-04-14 NaN NaN NaN NaN 1.02 NaN NaN NaN
2015-04-14 NaN NaN NaN NaN NaN 1.05 NaN NaN
2015-04-13 26.0 26.0 23.0 NaN NaN NaN NaN NaN
2015-04-13 22.0 21.0 19.0 NaN NaN NaN NaN NaN
Ни один из панд инструментов, которые я знаю, не работал: merge
, join
, concat
. Внешнее соединение merge дает точечный продукт, который не является тем, что я ищу, а concat
не может обрабатывать уникальные индексы.
Есть ли у вас идеи, как это можно достичь?
Примечание: длина информационных кадров не будет идентификационной.
Привет, ТНХ для ввода. Он работал в этом примере, где длина кадров была обязательной. Однако в моем случае это не гарантируется. –
Я пробовал его с разным количеством рядов, и он работал нормально. – TheBlackCat