Я имею dataframe, который содержит следующие данные:Удалить строки, на основе даты сравнения
Estimate Value Announce date Period Company
Estimate 1: 0,24 01-01-2015 31-12-2015 X
Estimate 2: 0,22 08-04-2015 31-12-2015 X
Estimate 3 0,26 07-05-2015 31-12-2014 Y
Estimate 4: 0,29 21-09-2015 31-12-2014 Y
Estimate 5: 0,21 30-09-2015 31-12-2013 Z
Я хотел бы включать только оценку в ранниеза период и за компании.
Пример: Компания x имеет за период 31-12-2015 две оценки, 1 и 2, но оценка 1 имеет более раннюю дату объявления, чем оценка 2. Поэтому я хотел бы удалить строку для оценки 2, а затем это для каждого периода и компании.
Дата объявления и период как в формате datetime
.
Что такое правильный способ для этого?
Спасибо!
моя первая догадка заключалась бы в том, чтобы создать словарь с ключом по периоду, а затем установить набор для дат анонса и отсортировать его на основе этого и взять только первый элемент – SirParselot
Можете ли вы привести мне пример этого? – F1990
или более простой способ сделать это, если периоды сгруппированы, - это просто установить первую в качестве самой ранней даты, проверить следующую, если раньше, чем удалить предыдущий набор, и удалить предыдущий, а затем удалить новый. – SirParselot