Мне нужна распределенная файловая система, которая должна масштабироваться до очень больших размеров (около 100 ТБ реалистичного макс). Размер файлов в основном зависит от диапазона 10-1500 КБ, хотя некоторые файлы могут достигать максимума примерно в 250 МБ.Проверка работоспособности распределенной файловой системы
Мне очень нравятся такие системы, как GFS со встроенной избыточностью для резервного копирования, которая бы - статистически - визуализировала потерю файлов в прошлом.
У меня есть несколько требований:
- Открытый исходный код
- Нет SPOFs
- Автоматическое репликации файлов (то есть, нет необходимости в RAID)
- Управляемый доступ клиента
- плоское пространство имен файлов - предпочтительно
- Встраиваемые удаления с удалением
- Проверенные развертывания
Я серьезно смотрел на MogileFS, так как он выполняет большинство требований. У него нет управляемых клиентов, но довольно просто сделать порт клиента Java. Тем не менее, нет встроенных версий. Без управления версиями мне придется делать обычные резервные копии, кроме репликации файлов, встроенных в MogileFS.
В принципе, мне нужна защита от ошибки программирования, которая внезапно очищает много файлов, которые она не должна иметь. В то время как MogileFS защищает меня с диска & машинных ошибок, реплицируя мои файлы по X числу устройств, это не спасает меня, если я делаю необоснованное удаление.
Я хотел бы иметь возможность указать, что операция удаления фактически не вступает в силу только после Y дней. Удаление будет логически выполнено, но я могу восстановить состояние файла в течение Y дней, пока он фактически не исчезнет. Кроме того, MogileFS не имеет возможности проверять повреждение диска во время записи - хотя это также можно добавить.
Поскольку мы являемся магазином Microsoft (Windows, .NET, MSSQL), я бы оптимально использовал основные части, которые будут работать в Windows, для удобства обслуживания, в то время как узлы хранения данных запускают * nix (или комбинацию) из-за лицензирование.
Прежде, чем я даже подумаю о том, чтобы опрокинуться, есть ли у вас какие-либо предложения для меня? Я также проверил HadoopFS, OpenAFS, Luster & GFS - но ни один из них не соответствует моим требованиям.
Я рекомендую [LizardFS] (http://lizardfs.com/) в качестве первого кандидата, затем [GfarmFS] (https://sourceforge.net/projects/gfarm/). – Onlyjob 2015-06-29 09:32:23