6

У меня есть несколько виртуальных машин на Windows Azure (Iaas), где размещен веб-сайт. Существует ряд сбалансированных по нагрузке интерфейсных виртуальных машин, все они подключаются к одной виртуальной машине с помощью SQL Express. Это работает хорошо.неожиданные перезагрузки Windows Azure VM (Iaas)

Однако!

Я получаю случайные перезагрузки по всем виртуальным машинам. Что касается интерфейсных виртуальных машин (с IIS), так как они сбалансированы по нагрузке, сайт не изменяется, и балансировщик нагрузки настраивается соответствующим образом. Но когда виртуальный хостинг базы данных перезагружается, сайт падает до тех пор, пока БД снова не вернется. Требуется < 3мин для загрузки, но это все еще неприемлемо, если это случается достаточно часто. Хотя перезагрузки относительно редки (2 раза в месяц на ВМ), иногда мы получаем неделю с 4 перезапусками на ВМ, что вызывает разочарование. Не все виртуальные машины перезапускаются так часто, и я не могу понять шаблон. Перезапускаются также непредвиденные (перезагрузка, а не выключение). Центр обработки данных - Западная Европа.

Microsoft подчеркивает, что SLA охватывает только 2VM в наборе доступности, который у меня не может быть для виртуальной машины базы данных (а корпоративная версия SQL стоит рука и три ноги). Кроме того, SQL Azure не является вариантом, так как приложение очень чатоточное, а база данных SQL Azure затухает во время пиковой нагрузки (хотя она работает с гладкими с SQL Express на средней VM!).

Мои вопросы: Нормально ли иметь столько перезагрузок? Есть ли у других людей такая же проблема? Каков ваш опыт в такой среде на Azure? Что я могу сделать, чтобы минимизировать это время простоя?

Спасибо всем!

+0

Я считаю, что этот вопрос по теме. Azure немного отличается, потому что конфигурация системы является типом «программирования» в широком смысле, потому что Azure необходимо правильно настроить для того, чтобы любой код работал внутри него. – Jarvis

+0

Определенно программирование связано с тем, что большинство из них подпадает под действие кода! –

ответ

3

Нормально ли иметь столько перезагрузок?

Да, это может произойти в течение определенного месяца, вам нужно встать SQL Server в режиме высокой готовности, чтобы действительно заставить это работать.

Да, это стоит руки и ноги. ; (

Каков ваш опыт работы с такой средой на Azure? Некоторые месяцы действительно хороши, некоторые месяцы плохие, зависит от вашего кластера и от какого центра данных вы находитесь. MS смешали наши аппаратные средства там, где есть датацентры. Это не значит, что они работают на старых ноутбуках в некоторых центрах обработки данных, но, по моему опыту, новые центры обработки данных имеют лучший набор в них и, следовательно, меньше перезапуска. Т.е. мы используем USA East.

Что я могу сделать для минимизировать это время простоя?

Высокая доступность со свидетелем - единственный способ предоставить вам доступность в виртуальной машине и да, это стоит, а рука и нога.

Другие серьезные варианты. Кэш-кеш. Вы должны использовать кеш компьютера, лазурный кеш и пытаться минимизировать ваши вызовы в базе данных. Это может снизить ваше чат-приложение и позволить вам вернуться в SQL Azure, но может дать вам достаточно возможности для восстановления после сбоя.

Очереди очереди помогут вам восстановить приложение и дать вам сообщение о том, что мы работаем над этим.

Используйте SQL Azure для перехода на другой ресурс. Синхронизация данных с использованием SQL Azure Sync из Premise (не уверен, что это работает с Express) для SQL Azure и введите код приложения, чтобы получить ошибку подключения и переход на другой ресурс.

Посмотрите на использование других частей Azure для части вашего приложения, чтобы уменьшить количество вызовов, поступающих в SQL, т.е.e Можете ли вы переместить материал в хранилище таблиц?

HTHS дает вам несколько идей.

+0

Хотя это подтверждает мои теории, это отстой. Виртуальные машины на других провайдерах гораздо более стабильны. Однако я согласен с тем, что кэширование и переход на SQL Azure - единственный способ! Благодаря! –

1

Служба инфраструктуры Windows Azure (IaaS) была только в общей доступности (GA или производства) около 3 недель, начиная с 16 апреля (см объявления here). До GA не было SLA, и вы бы увидели более частые перезагрузки ОС, поскольку различные исправления все еще применялись к ОС хоста. Вы говорите, что эта картина продолжалась с той же скоростью с 16 апреля?

Теперь, когда IaaS является GA, я не ожидал бы 4 перезапуска в неделю. Это говорит: Есть несколько причин, вы видите рестарт:

  • сбой оборудования хоста (это сносит все гостевые операционных системы, работающие на этом хосте) обновление программного обеспечения
  • хоста (и только если требует перезапуска Host os). Перезагрузка ОС хоста не должна происходить на частоте, которую вы видите.
  • Вопросы гостевой ОС. Здесь вещи отходят от PaaS (роль веб-работника/Cloud Services). В IaaS нет обслуживания гостевой ОС, выполняемого Azure; это все в ваших руках. При автоматической установке обновлений Windows можно перезагрузить компьютер. Возможно, вы можете столкнуться с проблемой уровня приложения, в результате чего ящик перестанет отвечать на запросы в течение длительного периода времени, в результате чего контроллер ткани Azure перезагрузит ваш ящик, поскольку он считает, что это нездорово. И ... ваше приложение может как-то свернуть коробку.

Если вы исключили ошибку приложения и уверены, что виртуальные машины находятся в хорошем состоянии в момент их перезагрузки, вам может потребоваться открыть билет поддержки с Microsoft, чтобы помочь в диагностике проблемы.

+1

Я создал билет поддержки с MS, и они подтвердили, что у Azure был неудачный узел. К сожалению, они исследовали только один перезапуск, но я подозреваю, что он применяется для всех. –

+1

И автоматическое обновление окон отключено;) –

Смежные вопросы