Кажется, что много вещей, которые я делаю в Пандах, имеют выпуклые вычислительные затраты времени в количестве данных, которые у меня есть (например, 1 строка занимает 1 секунду, 2 строки занимают 2,2 секунды, 4 строки занимают 6 секунд и т. Д.).Когда вычислительная стоимость применения функции выпукла?
Почему вычислительные затраты не линейно увеличивают объем данных, которые у меня есть? Например, эту функцию я написал:
def fractrips1brand(trip):
# Get number of transaction rows for THIS sepcific consumer
art = trip[trip.Item_Id.isin(insidegood)].Item_Id.nunique()
output = pd.Series({'numinsidegoods': art })
return output
gr_TILPS = TILPStemp.groupby('uniqueid')
output = gr_TILPS.apply(fractrips1brand)
Кажется, такие расходы.
Почему это не O(n)
?
Могу ли я запустить пример? – Veedrac