Я изучал идею использования распределенной файловой системы вместе с выделенными серверами вместо того, чтобы идти с Amazon S3, и результаты - это не что иное, как массивные головные боли!Хорошо распределенная файловая система общего назначения в моем случае?
Мой проект имеет следующие характеристики/требования:
Пользовательские файлы хранятся в выделенных серверов. Каждый файл хранится в двух отдельных машинах, расположенных в разных центрах обработки данных (150-200 миль друг от друга)
Я использую Amazon RDS для размещения связанной базы данных mysql (*). Это довольно компактный (только метаданные ID/файлов).
Файлы/данные около 50 ТБ. Естественно, что данные действительно меняются, и, безусловно, расти со временем
Моим вопрос: есть хорошее общее назначение, распределенных параллельная отказоустойчивая файловая система, что есть следующие характеристики:
Стабильная & достаточно быстро (загрузка/выгрузка)
Довольно легко установить & поддерживать хранение данных
ручки, так что я только должен заботиться об удалении/добавлении новых серверов, если в этом возникнет необходимость (т.е.. добавлять новые серверы в пул серверов в файловой системе путем редактирования простой конфигурации, или что-то подобное)
Я читал о OpenStack, GlusterFS, MogileFS, XtreemFS и т.д ... но чем больше я читал, тем больше я смущаюсь!
(*) Да, я понимаю противоречие. Понятно, что имеет смысл размещать базу данных на RDS. Но хранение (до) 50 Тбайт файлов пользователей на амазонке слишком дорого по сравнению с использованием выделенных серверов (при условии, что это достаточно хорошо).
PS. мое приложение еще не живое, поэтому я открыт для предложения, если у кого-то есть хорошая идея, которая подходит мне в моем случае.
EDIT Я не пытаюсь сделать клон S3, мне просто нужно использовать существующие инфраструктуры хостинга для создания мелкомасштабного решения облака, на мой вопрос о поиске права распределенной файловой системы для ее обработки/автоматизации.
Почему бы вам не попробовать GlusterFS или CephFS frist? Не просто читать, попробуйте. Они имеют разные рабочие характеристики и административные издержки. –
XtreemFS предназначен для внешнего облачного доступа, он не предназначен для использования в качестве общего хранилища между серверами. –
@ J-16SDiZ: Я был настолько ошеломлен всеми решениями там (не говоря уже о маркетинге blabla!), Что я чувствовал, что должен был попросить здесь просто убедиться, что я на правильном пути – TheDude