Инструмент для выполнения распределенных задач

Полезно использовать искру только для выполнения распределенных задач. У меня есть это требование обработки огромных наборов данных (чтение из базы данных, процесс, запись в базу данных), однако обработка выполнена на уровне строк. что означает, что мне не нужно сокращать или машинное обучение.Инструмент для выполнения распределенных задач

Было бы излишним использовать искру для такого рода требований. Что лучше всего подходит для такого рода требований. Я не хочу вписываться в инфраструктуру программного обеспечения, которая будет оптимально распределяться, обрабатывать сбои, повторы и т. Д.

источник

2016-01-27 Pacchy

Spark больше предназначен для обработки (на самом деле) больших наборов данных и встроенной памяти. Один из вариантов - использовать любой открытый источник IMDG и обрабатывать данные аналогичным образом, но (возможно) с меньшей сложностью.

Вы также можете выбрать свой движок IMDG, исходя из того, на каком языке вы хотите его использовать. Для .Net вы можете использовать NCache, а для Java их много, но вы можете использовать TayzGrid

источник

2016-02-04 06:51:37

Спасибо за ваш ответ. С точки зрения функциональности выглядит так же, как для меня, либо с искровым, либо с TayzGrid. Если размер данных является единственным критерием, мои данные обработки варьируются от МБ до сотен ГБ с разными запросами. – Pacchy

Рад помочь. Оверкилл любой используемой технологии может быть рассчитан по технической задолженности, которую он генерирует. Проще говоря, это время и деньги, которые вы потратили на это? Когда вы получите ответ, вы выберете свою технологию. –

Инструмент для выполнения распределенных задач

ответ

Смежные вопросы