2013-04-05 4 views
1

Я планирую разместить веб-сайт и хочу использовать HBase в качестве моей БД. Веб-сайт - это обмен фотографиями/хостингом, и я не хочу использовать РСУБД. Я хочу получить некоторый опыт хостинга, обучения HBase и проблем, с которыми сталкиваются и исправляются веб-разработчиками и разработчиками бэкэнд.Hbase on AWS EC2

Короче говоря, я хочу, чтобы создать и разместить сайт на Python + HBase с целью изучения их

Я опыт работы с EC2 и S3, и я бы с помощью АМС в качестве инфраструктуры.

Что я имею в виду оговорку:

  • 3 по умолчанию (1,7 г) экземпляров для HBase
  • 3 больше для веб-сервера + Memcached при необходимости

Я хочу, чтобы выяснить, если с ними все в порядке. Конечно, со временем я бы сделал тесты, оптимизацию кода и купил более крупные экземпляры (если я могу позволить себе их), если это необходимо.

На данный момент, указанные выше характеристики выглядят нормально, если они предназначены для 1000 пользователей?

Пользователи будут просматривать фотографии или добавлять комментарии, кроме загрузок своих фото. Предположим, что один пользователь загружает 20 фотографий в неделю в среднем.

Я ищу ответы, например: «Нет, HBase может работать только в одном экземпляре среднего размера для тысяч пользователей ...» Или «о, мой бог, только 3 сервера по умолчанию для 1000 пользователей ...»

ответ

2

1000 пользователей всего или 1000 пользователей одновременно? Ваша настройка должна быть полной для 1000 пользователей.

Что касается HBase на EC2: я бы настоятельно рекомендовал использовать HBase на Elastic Map Reduce (http://aws.typepad.com/aws/2012/06/apache-hbase-on-emr.html). Выполнение этого способа избавит вас от необходимости настраивать собственные кластеры EC2. Поверьте мне, я сделал это в обоих направлениях и не могу рекомендовать подход EMR. :)

+0

Запуск HBase на EMR для высокодоступного сервиса невозможно, поскольку главный узел не имеет механизма переключения при сбое, и если он столкнется с любыми проблемами, AWS просто прекратит работу всего кластера. – vascop

+0

@vascop - возможно, это было недоступно, когда вы отправляли сообщения, но https://aws.amazon.com/emr/mapr/ якобы предоставляет Hadoop HA (я утверждаю, что я ничего не верю, пока не проверю). :) –