Краткая версия вопроса: как построить надежную программу подсчета слов (топологию) в Twitter Буря, которая производит точные результаты, даже если происходит сбой? Возможно ли это?Как построить отказоустойчивое приложение в Storm?
Длинная версия: Я изучаю Twitter Storm и пытаюсь понять, как ее использовать. Я следовал за tutorial и нашел это очень простой концепцией. Но пример подсчета слов, описанный в учебнике, не является отказоустойчивым (потому что болты сохраняют некоторые данные в памяти). Однако сохранение одних и тех же данных в базовом БД приводит к двойному счету, если событие повторно отправляется в начало цепи (что происходит, когда некоторые из болтов сбой).
Должен ли я видеть Twitter Storm как платформу реального времени для производства частично точных результатов и по-прежнему зависит от MapReduce, чтобы получить точные данные?
Спасибо, что помогает немного. О первом варианте ... могу ли я «разбить» кортеж в носике так, чтобы разные (независимые) пути вычислений обрабатывались параллельно? (так что, если один из них не работает, другие не воспроизводятся, а только оскорбительные?) В общем, я хотел бы знать, как создать систему, которая всегда давала бы точные результаты (или, по крайней мере, знала, что они не точны). Я говорю о подсчете статистики, ничего сложного. – johndodo