Я пытаюсь найти решение для повторяющейся агрегации данных из нескольких тысяч удаленных файлов данных XML и JSON, используя очереди Azure и WebJobs для извлечения данных.Azure WebJobs для агрегирования
В принципе, URL-адрес конечной точки ввода какого-либо типа будет вызываться (с URL-адресом данных как параметр) на веб-сайте/приложении Azure. Он должен запускать фоновое задание WebJobs (или он может непрерывно работать и периодически проверять очередь для новой работы), извлекать URL-адрес данных, а затем возвращать внешний URL-адрес конечной точки при завершении.
Теперь главной проблемой является объем и его производительность/масштабирование/накладные расходы. Будут около 10 000 URL-адресов, которые будут вызываться каждые 10-60 минут (большинство URL-адресов будут загружаться каждые 60 минут). Что касается этого сценария повторяющегося большого объема фоновых заданий, у меня есть несколько вопросов:
Is Azure WebJobs (? Или рабочие) правильный вариант для фоновой обработки в этом объеме, и иметь возможность масштабирования соответственно?
Для такого объема, который будет наиболее подходящим для уровня Azure (сравнение на http://azure.microsoft.com/en-us/pricing/details/app-service/)? Или будет работать только Cloud или VM (ы) в этом масштабе?
Любые предложения или советы приветствуются.
Thanks Rick. Несколько других вопросов в отношении ваших предложений: (1) На странице цены он говорит (как вы уже сказали), что базовый уровень можно масштабировать до 3 экземпляров, так что автоматически расширяются экземпляры от Azure на основе нагрузки и трафика к веб-приложению, или мы создаем каждый экземпляр и развертываем их отдельно? – Nick
(2) Я предполагаю, что цена, указанная для базового уровня, на один экземпляр (например, B1 составляет ~ 56 долларов США за экземпляр, до 3 экземпляров), поэтому, если приложение автоматически масштабируется, цена автоматически увеличится, правильно ?! – Nick
(3) Как и в случае с гостем (хотя позже я буду запускать некоторый бенчмаркинг), какова, по вашему мнению, будет пропускная способность (например, рабочие потоки, задачи в минуту и т. Д.) Для повторной выборки URL-адресов (I/O-ориентированный а не центрального процессора), учитывая, что один WebJob работает на одном экземпляре с 1-2 ядрами? – Nick