У меня есть DataFrame под названием ДФ, которая содержит данные ниже:Панда: Создать новый столбец в DataFrame из другого столбца, требующая строка манипуляции
Index Column1 Column2
0 SEP_2013_QUANTITY 4
1 SEP_2013_PRICE 4.99
2 JAN_2013_PRICE 8
3 JAN_2013_QUANITY 10.99
Мне нужно создать DataFrame как ниже. Месяц в формате YYYY-MM-DD с днем всегда быть 15:
Index MONTH PRICE QUANTITY
0 2013-09-15 4.99 4
1 2013-01-15 10.99 8
Я попытался с помощью строковых функций rsplit и заменить в новом заявлении создания колонки, но я получаю сообщение об ошибке, что функция строки ожидающей строка и получает серию.
Я пытаюсь что-то вроде:
df['new_column'] = str.rsplit(df.Column1,'_',1)[0]
Это должно вернуть что-то вроде 'JAN_2013'.
Мне также нужно проверить наличие _QUANTITY или _PRICE в столбце 1, чтобы узнать, следует ли поместить значение в новую колонку PRICE или QUANTITY.
Заранее благодарим за помощь/руководство.
Try применяя .str к вашему столбцу, а затем используйте строковые методы по вашему выбору: 'df.Column1.str. ... ' – leroyJr