2012-03-16 5 views
0

Мы должны хранить около 13 миллионов файлов и выполнять некоторые стандартные операции над файлами. Мы используем Windows. Первый вопрос: можем ли мы сохранить его в файловой системе? Общий размер файла составит около 6000 ТБ. Я проверяю gridfs на MongoDB. Я не знаю, хороший ли это подход. Мы будем использовать Java на сервере.
Если он может удобно хранить эти файлы, то какова будет производительность для извлечения файла и обслуживания его пользователю и операций, таких как переименование файлов, обновление метаданных и т. Д.
Нам также необходимо выполнить резервное копирование всех файлов во вторичное хранилище файловой системы позже. Но файлы в gridfs будут храниться в кусках. Итак, вопрос в том, как мы можем быстро получить все эти файлы и отправить их во вторичную файловую систему.
Пожалуйста, дайте мне знать подход, который я должен принять.13 миллионов файлов gridfs mongo

+0

@JeffFoster, все еще не уверен, какой путь следовать. Заглядывая в некоторые высокопроизводительные файловые системы, Ceph, Luster и т. Д. Я не очень разбираюсь в файловых системах. Является ли gridfs лучшим вариантом ...? –

+0

@Vish Как написано Джеффом, это что-то для профессионала ... И не для «нормального» профессионала, вероятно ... Для pro pro :-) – xanatos

ответ

5

MongoDB - это веб-шкала, поэтому должно быть хорошо

+0

Как резервное копирование всех файлов, хранящихся в gridfs, во вторичное хранилище файловой системы работать, легко ли это сделать? –

+2

Обязательное сообщение NSFW: http://www.youtube.com/watch?v=b2F-DItXtZs. Кроме того, резервное копирование GridFS в другую файловую систему не очень интуитивно и, если вы храните файлы в Windows, извлечение их из базы данных GridFS сделает их нечитаемыми многими приложениями MS, такими как Word, Excel, Photoviewer. Если вы работаете в Linux, все должно быть в порядке. – PinkElephantsOnParade

Смежные вопросы