У меня есть система, которая получает файлы журналов из разных мест через http (> 10k производителей, 10 журналов в день, ~ 100 строк текста каждый).Хранение многих файлов журнала
Я хотел бы сохранить их, чтобы иметь возможность вычислить разное. статистика по ним в ночное время, экспортировать их (заказывается по дате поступления или первой строке контента) ...
Мой вопрос: какой способ хранить их лучше?
- плоские текстовые файлы (с надлежащей блокировкой), один файл на загруженный файл, один каталог в день/производитель
- плоские текстовые файлы, один (большой файл) в день для всех производителей (проблема здесь будет индексация и блокировка)
- Таблица базы данных с текстом (MySQL является предпочтительным, по внутренним причинам) (рь с DB продувкой, как удалить может быть очень долго!)
- Таблица базы данных с одной записью в строке текста
- базы данных с шардинге (один стол в день), что позволяет простую очистку данных. (это разделение. Однако версия mysql, к которой я имею доступ (т.е. поддерживается внутренне), не поддерживает ее)
- Документация на основе базы данных на языке couchdb или mongodb (проблема может заключаться в индексировании/зрелости/скорости приема)
Любые советы?
Это вопрос sys-admin, который означает, что он принадлежит на сайте сестры «Ошибка сервера» serverfault.com – tylerl
Не совсем, ответ на то, что я прошу, сильно влияет на развитие – makapuf