Использование панды Я добавляю новые столбцы в DataFrame:Панды извлечь несколько столбцов
df["Year"] = df["concat"].str.extract("(\d\d\d\d$)", expand=False)
df["Month"] = df["concat"].str.extract("(\d\d)\_\d\d\d\d$", expand=False)
df["Measure"] = df["concat"].str.extract("^(.*)\_\d\d\_\d\d\d\d$", expand=False)
Это работает, но очень медленно. Я думал о том, делать все 3 операции за один шаг (в надежде, что увеличит производительность):
df["Measure", "Year", "Month"] = (df["concat"].str.extract("^(?P<Measure>.*)\_(?P<Month>\d\d)\_(?P<Year>\d\d\d\d)$", expand=True))
Но это не работает (ValueError: Неверное число элементов прошло 3, размещение подразумевает 1).
Как заставить это работать или как эффективно извлечь эту информацию?
https://meta.stackexchange.com/a/5235/289619 – 0m3r