Местоположение данных для Hadoop в облачных вычислениях

В настоящее время Hadoop достигает локальности данных, назначая задачи узлу, который содержит данные или находится рядом с тем, который работает (например, с той же стойкой). Однако мне интересно, может ли такая же концепция применяться в облачных вычислениях, в которой Hadoop развертывается на множестве виртуальных машин, поскольку информация о физических уровнях, например. какие физические машины в настоящее время размещают эти виртуальные машины, могут быть недоступны.Местоположение данных для Hadoop в облачных вычислениях

источник

2014-01-21 Long Thai

В большинстве облачных средах вы полностью теряете преимущества Hadoop в области данных, так как хранилище обычно подключено к вашим виртуальным машинам.

Есть несколько виртуальных расширений для Hadoop, которые позволяют указывать виртуальные хосты, которые используют одну и ту же физическую инфраструктуру (то есть память и вычислить), так что Hadoop может быть «виртуальным знанием» базового оборудования, но они имеют тенденцию существуют только в 1) частных облачных облаках или (более вероятно) 2) среды Hadoop PaaS.

источник

2014-01-21 14:48:40 jtravaglini

Местоположение данных для Hadoop в облачных вычислениях

ответ

Смежные вопросы