Мой вопрос касается концепции распределенного кеша специально для Hadoop и следует ли его называть распределенным кешем. Обычным определением распределенного кэша является «Распределенный кеш охватывает несколько серверов, чтобы он мог расти в размере и в транзакционной емкости».Концепция распределенного кэша в Hadoop
Это неверно в hadoop, так как распределенный кеш распространяется на все узлы, выполняющие задачи, то есть тот же файл, указанный в коде драйвера.
Не следует ли это называть репликативным кешем . Пересечение кеша на всех узлах должно быть нулевым (или близким к нему), если мы будем придерживаться стандартного определения распределенного кэша. Но для hadoop результатом пересечения является тот же файл, который присутствует во всех узлах.
Насколько я понимаю, я что-то не хватает? Пожалуйста, направляйте.
Благодаря