Я новичок в hadoop и в настоящее время работает над hadoop. У меня небольшой запрос.Hadoop: Получение имени входного файла в картографе только один раз
У меня есть около 10 файлов в папке ввода, которые мне нужно передать моей программе уменьшения карты. Я хочу, чтобы имя файла в моем mapper, так как мое имя_файла содержит время создания этого файла. Я видел людей, использующих FileSplit, чтобы получить имя файла в mapper. Если допустим, что мои входные файлы содержат миллионы строк, то каждый раз, когда будет вызываться код карты, он получит имя файла, а затем извлечет время из файла, что, очевидно, повторяет много времени для одного и того же файла. Как только я получаю время в картографе, мне не нужно снова и снова назначать время из файла.
Как я могу это достичь?
Благодаря его worrked. – Nipun