Я пытаюсь взять txt-файл размером 1,8 мБ. После этого есть пара строк заголовка, все данные, разделенные пробелом. Я могу вытащить данные с помощью панд. Что я хочу делать с данными:Python: Правильно ли использовать панды?
1) Вырежьте несекретные данные. т.е. первые 1675 строк, которые я хочу удалить, и последние 3-10 строк, меняются изо дня в день, я также хочу удалить. Я могу удалить первые строки, вроде. Большая проблема с этой идеей, которую я имею прямо сейчас, точно знает, где находится указатель 1675. Используя что-то вроде
df = df[df.year > 1978]
перемещает только начальный «указатель» на 1675 Если я пытаюсь
dataf = df[df.year > 1978]
он просто дает мне чистую копию того, что я бы с первой линией. Он по-прежнему сохраняет указатель на ту же самую начальную точку 1675. Это не позволит мне получить доступ к любому из первых 1675 строк, но они все еще явно существуют.
df.year[0]
Он возвращается с ошибкой, предполагая, что строка 0 не существует. Мне нужно выйти и искать, чтобы найти то, что первая читаемая строка ... вместо того, чтобы удалять строки и перемещать новый указатель до 0, просто перемещает указатель на 1675 и не позволит доступ к чему-либо ниже, чем что. Я до сих пор не нашел способ определить, что последний номер строки через программирование, через оболочку легко, но мне нужно сделать это через программу, чтобы я мог настроить цикл для пункта 2.
2) Я хочу, чтобы иметь возможность принимать средние данные, скользящие средние числа «x» и создавать новый столбец с новыми данными, как только я вычислил скользящую среднюю. Я думаю, что я могу создать новый столбец с помощью инструкции Series ... Я думаю ... Я еще не пробовал, хотя, как я еще не смог это сделать.
3) После всей этой и еще одной математики я хочу, чтобы иметь возможность графа данных с самодельным графиком. Я думаю, что это должно быть легко, как только я закончу все остальное. Я уже создал образец графа и может начертить точки/линии на графике, как только у меня будут данные для работы.
Является ли панда правом lib для проекта или я должен пытаться использовать что-то еще? До сих пор больше исследований я делаю ... чем больше потерял, тем больше у меня получается, потому что все, что я пытаюсь, дает мне немного дальше, но меня еще больше возвращает в одно и то же время. В чем-то подобном я видел упоминание использования чего-то еще, когда вы хотите сделать математику в блоке данных. Их не было никаких указаний относительно того, что он использовал.
Это звучит как панды действительно поможет, но на данный момент мы не можем помочь, поскольку там слишком много частей на этот вопрос и не пример ... –