Это мой первый раз, когда я использовал Python (раньше я использовал R), поэтому, пожалуйста, несите меня по этому вопросу. В принципе, я хотел бы использовать цикл for для сравнения значения datetime
в каждой строке со всеми остальными значениями datetime
в других строках в кадре данных pandas pd
, а если разница во времени составляет 4 часа или менее, сохраните эти строки в подмножестве объект df
для последующей обработки. Однако я не уверен, с чего начать.Pandas Use Loop для сравнения datetime в каждой строке со всеми строками и сохранением подмножества результатов
Давайте предположим, что это мой набор данных:
Origin Destination Time
0 New York Cairo 2016-03-28 02:00:00
1 New York Los Angeles 2016-03-28 04:00:00
2 Boston Hawaii 2016-03-28 06:00:00
3 New York Boston 2016-03-28 08:00:00
4 Los Angeles Boston 2016-03-28 10:00:00
5 Los Angeles Hawaii 2016-03-28 12:00:00
Это то, что результат должен выглядеть следующим образом:
>>>df[0]
Origin Destination Time
0 New York Cairo 2016-03-28 02:00:00
>>>df[1]
Origin Destination Time
0 New York Cairo 2016-03-28 02:00:00
1 New York Los Angeles 2016-03-28 04:00:00
>>>df[2]
Origin Destination Time
0 New York Cairo 2016-03-28 02:00:00
1 New York Los Angeles 2016-03-28 04:00:00
2 Boston Hawaii 2016-03-28 06:00:00
>>>df[3]
1 New York Los Angeles 2016-03-28 04:00:00
2 Boston Hawaii 2016-03-28 06:00:00
3 New York Boston 2016-03-28 08:00:00
>>>df[5]
Origin Destination Time
3 New York Boston 2016-03-28 08:00:00
4 Los Angeles Boston 2016-03-28 10:00:00
5 Los Angeles Hawaii 2016-03-28 12:00:00
Я не понимаю, как получить это.
* 4 часа или менее хранить эти строки * ... четыре часа меньше по сравнению с какой конкретной метрикой ? Любая строка? Вы можете не подмножать ничего! – Parfait