У меня большой размер данных, и я храню много избыточных значений, которые затрудняют обработку моих данных. У меня есть dataframe формы:Pandas - расставить значения столбцов в новые столбцы
import pandas as pd
df = pd.DataFrame([["a","g","n1","y1"], ["a","g","n2","y2"], ["b","h","n1","y3"], ["b","h","n2","y4"]], columns=["meta1", "meta2", "name", "data"])
>>> df
meta1 meta2 name data
a g n1 y1
a g n2 y2
b h n1 y3
b h n2 y4
, где у меня есть имена новых столбцов я хотел бы в name
и соответствующие данные в data
.
Я хотел бы, чтобы произвести dataframe формы:
df = pd.DataFrame([["a","g","y1","y2"], ["b","h","y3","y4"]], columns=["meta1", "meta2", "n1", "n2"])
>>> df
meta1 meta2 n1 n2
a g y1 y2
b h y3 y4
Столбцов под название meta
находятся вокруг 15+ других столбцов, которые содержат большую часть данных, и я не думаю, что особенно хорошо подходят для для индексирования. Идея состоит в том, что в настоящее время у меня много повторяющихся/избыточных данных, хранящихся в meta
, и я хотел бы представить более компактную информационную рамку.
Я нашел некоторые аналогичные Qs, но не могу определить, какие операции мне нужно делать: поворот, переиндексация, стекирование или отрыв и т. Д.?
PS - исходные значения индекса не имеют значения для моих целей.
Любая помощь будет высоко оценена.
Вопрос Я думаю, что связано:
Я думаю, что следующий Q связано с тем, что я пытаюсь сделать, но я не могу понять, как применить его, так как я не хочу, чтобы произвести больше индексов.
То, что я назвал 'meta', на самом деле представляет собой несколько других столбцов. – oliversm
Извините, столбец 'meta' не один, но больше столбцов, например' meta1', 'meta2' ...? – jezrael
Вопрос отредактирован: надеюсь, это делает его более ясным. – oliversm