Мне нужно прочитать 2 разных входных файла и записать 2 выходных файла. Первый файл - основной входной файл, второй - словарь. Моя работа должна обрабатывать оба файла одновременно в mapper, а также в редукторах. Как я понял, я не могу использовать multiinput. Я пробовал использовать BufferedReader и BufferedWriter. Но потом я создал другую работу в mapper и другую работу в редукторе. Как я могу решить проблему?Чтение 2 входных файлов в hadoop mapreduce
0
A
ответ
0
Вы можете использовать несколько входных файлов, см. http://hadoop.apache.org/docs/stable/api/org/apache/hadoop/mapred/lib/MultipleInputs.html.
MultipleInputs.addInputPath(job, inputPath1, TextInputFormat.class, MyMapper.class);
MultipleInputs.addInputPath(job, inputPath2, TextInputFormat.class, MyMapper.class);
Вы можете иметь более одного файл в inputPath1, inputPath2 ..
0
Если размер вашего второго файла меньше, вы можете использовать распределенный кэш и использовать файл в картографах для обработки. См. http://hadoop.apache.org/docs/stable/api/org/apache/hadoop/filecache/DistributedCache.html
Смежные вопросы
- 1. Hadoop MapReduce: Соответствующий размер входных файлов?
- 2. Чтение файлов свойств Java в приложениях Hadoop MapReduce
- 3. Hadoop MapReduce TextInputFormat - как выполняется разделение файлов
- 4. Объекты из памяти в качестве входных данных для Hadoop/MapReduce?
- 5. Чтение входных файлов в FORTRAN
- 6. QCommandLineOption чтение входных файлов
- 7. Чтение два входных файлов
- 8. Hadoop - общая линия входных файлов
- 9. Несколько файлов в mapreduce
- 10. Обработка входных файлов в MapReduce отдельно
- 11. Hadoop MapReduce обеспечивает вложенные каталоги в качестве входных данных задания
- 12. Hadoop - MapReduce
- 13. Сортировка в MapReduce Hadoop
- 14. Hadoop: укажите каталог в качестве входных данных для MapReduce job
- 15. Как MapReduce читает из нескольких входных файлов?
- 16. MapReduce Apache Hadoop Technology
- 17. MapReduce Индивидуальная обработка нескольких входных файлов
- 18. Дубликаты в hadoop mapreduce
- 19. Обработка 2 входных файлов
- 20. Hadoop MapReduce
- 21. DataJoins в Hadoop MapReduce
- 22. компиляция файлов классов для Hadoop MapReduce
- 23. Вход Hadoop/MapReduce
- 24. Чтение из входных файлов в Java
- 25. Несколько входных файлов В одном классе карт Hadoop?
- 26. Ошибка в Hadoop MapReduce
- 27. Hadoop MapReduce thinking
- 28. Hadoop 2 - MapReduce Проблема с использованием PIG over hadoop
- 29. Чтение из входных файлов в haskell
- 30. Стол объединяется в MapReduce - Hadoop