Моя задача - создать распределенную систему для статических изображений/видеофайлов. Размер данных - около десятков терабайт. Это в основном для доступа к HTTP (таким образом, обработка данных отсутствует или просто простая обработка, например изменение размера, однако это не важно, поскольку это можно сделать непосредственно в приложении).Подавать статические файлы от Hadoop
Чтобы быть немного более ясно, что это система, которая:
- должны быть распределены (горизонтальная шкала), так как общий размер данных очень велик.
- В первую очередь обслуживает небольшие статические файлы (например, изображения, миниатюры, короткие видеоролики) через HTTP.
- Как правило, нет необходимости в обработке данных (при этом MapReduce не требуется)
- Настройка HTTP-доступа к данным может быть легко выполнена.
- (Должно иметь) хорошая пропускная способность.
Я рассматриваю:
Native сетевая файловая система: Но это, кажется, не представляется возможным, поскольку данные не могут поместиться в одну машину.
Hadoop файловая система. Ранее я работал с Hadoop mapreduce, но у меня нет опыта использования Hadoop в качестве статического репозитория файлов для HTTP-запросов. Поэтому я не знаю, возможно ли это, или если это рекомендуемый способ.
MogileFS. Это кажется многообещающим, но я считаю, что использование MySQL для управления локальными файлами (на одной машине) создаст слишком много накладных расходов.
Любое предложение пожалуйста?
Привет, Крис, я изучал возможности, доступные для распределенных fs для обслуживания изображений, и weed-fs outshone all. Я хотел бы знать, есть ли какие-либо недостатки в том, чтобы сбрасывать файлы в сорняки, не организуя их в папки. Я действительно новичок и мало информации, поэтому я связался с вами напрямую. С нетерпением жду вашего ответа. Также, пожалуйста, я могу получить образец конфигурации xml. Я использую ubuntu, jdk-8 и подключаюсь через java-клиент, созданный zhangxu – qualebs
Вам нужно будет иметь место для хранения сгенерированных идентификаторов файлов для загруженных файлов. Если вам нужно перемещаться по папкам, возможно, вы также можете сохранить их вместе с идентификаторами файлов. Или вы можете использовать filed-файл. – chrislusf