У меня есть программа python, которая сжимает большой набор данных с помощью Pandas. В настоящее время требуется около 15 минут. Я хочу записать (stdout & отправить метрику в Datadog) о ходе выполнения задачи. Есть ли способ получить% -полностью задачи (или функции)? В будущем я могу иметь дело с большими наборами данных. Задача Python, которую я делаю, представляет собой простую группировку большого кадра данных панд. Что-то вроде этого:процентное завершение долговременной задачи python
dfDict = {}
for cat in categoryList:
df1 = df[df['category'] == cat]
if len(df1.index) > 0:
df1[dateCol] = pd.to_datetime(df[dateCol])
dfDict[cat] = df1
здесь, то categoryList имеет около 20000 пунктов, а ДФ большой кадр данных, имеющий (скажем) а 5 миллионов строк.
Я не ищу ничего интересного (например, progress-bars ..). Просто процентное значение. Есть идеи?
Спасибо!
Возможный дубликат [Python Progress Bar] (http://stackoverflow.com/questions/3160699/python-progress-bar) – dodell