Недавно интервьюер задал мне вопрос:в Hadoop, «Как вы можете отдать весь файл в качестве входных данных для картографа?»
в Hadoop «Как вы можете отдать весь файл в качестве входных данных для картографа?»
Я сказал, задав размер блока или размер разделения равным размеру файла.
Он сказал, что это неправильно. Можете ли вы сказать мне правильный ответ. Я искал ее, но не получил ответа.
Blocksize не является глобальным, его можно установить для каждого файла. –
Нравится это: hadoop fs -D fs.local.block.size = 10000 -put local_name remote_location –
Спасибо, что исправил мой пробел в знаниях. В этом случае я не понимаю, почему его ответ «неправильный». Я думаю, как вы сказали, он просто хотел услышать решение isSplitable. – Esquive