У меня есть набор данных, который выглядит следующим образом:Выберите определенные значения строки и сделать их столбцы в панд
+-------------------------+-------------+------+--------+-------------+--------+--+
| | impressions | name | shares | video_views | diff | |
+-------------------------+-------------+------+--------+-------------+--------+--+
| _ts | | | | | | |
| 2016-09-12 23:15:04.120 | 1 | Vidz | 7 | 10318 | 15mins | |
| 2016-09-12 23:16:45.869 | 2 | Vidz | 7 | 10318 | 16mins | |
| 2016-09-12 23:30:03.129 | 3 | Vidz | 18 | 29291 | 30mins | |
| 2016-09-12 23:32:08.317 | 4 | Vidz | 18 | 29291 | 32mins | |
+-------------------------+-------------+------+--------+-------------+--------+--+
Я пытаюсь построить dataframe скормить регрессионной модели, и я хотел бы анализировать отдельные строки как функции. Для этого мне хотелось бы, чтобы в кадре данных была такая цифра
+-------------------------+------+--------------+-------------------+-------------------+--------------+-------------------+-------------------+
| | name | 15min_shares | 15min_impressions | 15min_video_views | 30min_shares | 30min_impressions | 30min_video_views |
+-------------------------+------+--------------+-------------------+-------------------+--------------+-------------------+-------------------+
| _ts | | | | | | | |
| 2016-09-12 23:15:04.120 | Vidz | 7 | 1 | 10318 | 18 | 3 | 29291 |
+-------------------------+------+--------------+-------------------+-------------------+--------------+-------------------+-------------------+
Какой был бы лучший способ сделать это? Я думаю, что это было бы легче, если бы я только пытался выбрать 1 строку (15 минут), просто разобрать ненужные строки и поворот.
Однако, мне нужен 15мин и 30мин особенность, и я не уверен в том, как действовать в необходимости этих колонок
ли вы сейчас о [ 'pandas.DataFrame.get_dummies()'] (HTTP://pandas.pydata.org/pandas-docs/stable/generated/pandas.get_dummies.html), это не совсем то, что вы просили, но может быть обходным путем. – quapka
Выход, который вы хотите, не имеет смысла. Ваша строка _ts с 2016-09-12 23: 15: 04.120 не имеет 30-минутных показов. –