У меня есть Dataframe df
:Линейная регрессия по панды Dataframe со значениями х, как индекс
[250 rows x 120 columns]
0 1 2 3 4 5 \
lag time [s]
0.041667 0.038638 0.193427 0.126253 0.058737 0.122129 0.117425
0.083333 0.104397 0.323418 0.390540 0.194786 0.247005 0.242796
0.125000 0.168620 0.577642 0.782489 0.389399 0.381930 0.325373
0.166667 0.241057 0.912038 1.361542 0.560007 0.346316 0.343614
0.208333 0.246506 0.636547 1.863711 0.767916 0.487872 0.203043
...
Мне нужно, чтобы соответствовать y = a*x
с x=df.index.values
времен запаздывания для каждого столбца
Некоторые столбцы могут содержать NaN и хотел бы восстановить другой результат в pd.DataFrame({'column' : [],'slope' : [], 'stderr' : [] })
я мог бы извлечь индивидуально x
, y
данные и соответствовать данным используя numpy fitline()
, но это выглядит для меня утомительным.
Есть ли лучший способ сделать работу, используя panda ols?
Спасибо за быстрый ответ. – user3253105
Нет проблем, просто дайте мне знать, если это не то, что вы ищете, и я могу настроить его. – horatio
Сброс добавляет столбец в мой df, но меня путают с формулой ols. Мне нужно, чтобы x было временем задержки и соответствовало каждому другому столбцу, чтобы получить отдельную подгонку за столбец. Как мне определить мою модель? – user3253105