У меня есть некоторые данные, которые я импортирую в рамку данных Pandas. Эти данные «кумулятивный» и индексированный по временным рядам, смотрите ниже:Python Pandas dataframe вычесть кумулятивный столбец
Raw data
2016-11-23 10:00:00 48.6
2016-11-23 11:00:00 158.7
2016-11-23 12:00:00 377.8
2016-11-23 13:00:00 591.7
2016-11-23 14:00:00 748.5
2016-11-23 15:00:00 848.2
Данные обновляются ежедневно, поэтому время серия будет двигаться вперед в день каждый день.
Что мне нужно сделать, так это взять этот фреймворк и создать новый столбец, как показано ниже. Первая строка просто копирует данные из столбца «Необработанные данные». Затем каждая последующая строка берет данные из столбца «Исходные данные» и вычитает значение, появившееся до него, например. 158.7 - 48.6 = 110.1, 377.8 - 158.7 = 219.1 и т. Д.
Кто-нибудь знает, как я могу достичь того, что находится в столбце «Данные процесса» в Python/Pandas?
Raw data Processed data
23/11/2016 10:00 48.6 48.6
23/11/2016 11:00 158.7 110.1
23/11/2016 12:00 377.8 219.1
23/11/2016 13:00 591.7 213.9
23/11/2016 14:00 748.5 156.8
23/11/2016 15:00 848.2 99.7
вам нужен столбец «Обработано данных» для сброса первого значения каждый день делать, или Должен ли он быть одним длинным потоком? – DSM