Я пытаюсь сделать некоторый анализ данных на Pythonista 3 (приложение iOS для python), однако из-за библиотек C pandas он не компилируется на устройстве iOS.Как фильтровать CSV-файл без Pandas? (Лучший заменитель для Pandas в Pythonista)
Есть ли какая-либо замена для Панд? Будет ли numpy быть опцией для данных типа string
?
Набор данных у меня есть на данный момент является история сообщений между моими друзьями и I.
Вся история в одном из CSV-файла. Каждая строка имеет столбцы «day_of_the_week», «date», «time_of_message», «author_of_message», «message_body»
Целью анализа является подготовка отчета о нашем чате за последний год.
Я хочу иметь возможность подсчитывать количество сообщений, отправленных каждым другом. Я хочу, чтобы иметь возможность построить гистограмму часов, в которых сообщения, отправленные каждым другом. Затем я хочу сделать подсчет слов по отдельности и в качестве группы.
В Пандах я знаю, как это сделать. Например:
df = read_csv("messages.csv")
number_of_messages_friend1 = len(df[df.author_of_message == 'friend1']
Как фильтровать файл csv без Pandas?
Я не знаю точных ограничений для Pythonista, но у numpy есть аналогичные требования к пандам - так что это вряд ли сработает, если у панд нет. Добавление некоторых подробностей о том, что вы хотите сделать, может помочь дать более подходящие результаты –
Я тоже думал о numpy и Pandas. Но это то, что предлагает pythonista.Я думаю, разработчик приложения скомпилировал numpy в python, чтобы включить этот пакет. Во всяком случае, я отредактировал вопрос, чтобы сделать мою проблему более ясной. – zeh
Если numpy не работает, вы можете использовать стандартные инструменты библиотеки для чтения csv в списки «records» (namedtuple может быть вашим другом здесь), но это потребует много циклов for-loop, когда вы хотите запросить вещи. Я не знаю, может ли облегчить dbms как sqlite. –