Я обрабатываю много текста/данных, которые я обмениваю между Python, R, а иногда и Matlab.SQLite или текстовый файл?
My go-to - это текстовый файл, но иногда используется SQLite для хранения данных и доступа из каждой программы (хотя и не для Matlab). Я не использую GROUPBY, AVG и т. Д. В SQL так же сильно, как я делаю эти операции в R, поэтому я не обязательно требую операций с базой данных.
Для таких приложений, которые требуют обмена данными между программами для использования доступных библиотек на каждом языке, существует хорошее эмпирическое правило, по которому используется формат/метод обмена данными (даже XML или NetCDF или HDF5)?
Я знаю, что между Python -> R существует rpy или rpy2, но я задавался вопросом об этом вопросе в более общем смысле - я использую многие компьютеры, у которых все нет rpy2, а также используют несколько других частей научного анализа программное обеспечение, требующее доступа к данным в разное время (этапы обработки и анализа также разделяются).
+1 для sqlite и предвидения широкого использования базы данных в будущем, хотя это не очевидно сейчас. –
Спасибо - да, не чтение всего файла, безусловно, его плюс. – hatmatrix