Я хочу реплицировать строки в Dataframe Pandas. Каждая строка должна повторяться n раз, где n - поле каждой строки.Репликация строк в кадре данных pandas по значению столбца
import pandas as pd
what_i_have = pd.DataFrame(data={
'id': ['A', 'B', 'C'],
'n' : [ 1, 2, 3],
'v' : [ 10, 13, 8]
})
what_i_want = pd.DataFrame(data={
'id': ['A', 'B', 'B', 'C', 'C', 'C'],
'v' : [ 10, 13, 13, 8, 8, 8]
})
Возможно ли это?
Есть ли основания для этого? Я думаю, что дублирование данных лучше всего избежать. – greole
Ну, это промежуточный шаг: я генерирую столбец «v» в соответствии с распределением вероятности, а затем добавляю еще один столбец, произвольно выбирая строки из другого набора данных. –
По-прежнему я не вижу причины не делать этого напрямую. Но мне нужна дополнительная информация о том, чего вы на самом деле пытаетесь достичь. – greole