Мне нужно создать программу для уменьшения карты, которая считывает файл Excel из HDFS и делает некоторый анализ на нем. Оттуда сохраните вывод в формате файла excel. Я знаю, что TextInputFormat используется для чтения TXT-файла из HDFS, но какой метод или какой inputformat мне следует использовать?Hadoop InputFormat for Excel
0
A
ответ
0
Вообще, Hadoop является излишеством для этого сценария, но некоторые соответствующие решения
разобрать файл внешне и преобразовать в Hadoop совместимого формата
прочитать весь файл в виде одной записи see this answer
использование двух цепей. 1-й, как в 2, читает файл навалом и испускает каждую запись в качестве ввода для следующего задания.
Смежные вопросы
- 1. Hadoop MapReduce InputFormat Устарела?
- 2. Hadoop: NullPointerException с Настраиваемым InputFormat
- 3. Использование Hadoop InputFormat в Pyspark
- 4. Интерфейс InputFormat vs Class InputFormat
- 5. custom inputformat для чтения json в hadoop
- 6. OrcNewInputformat как inputformat для Hadoop потокового
- 7. Сколько типов InputFormat есть в Hadoop?
- 8. Hadoop ClassCastException для значения по умолчанию InputFormat
- 9. Возвращаемые значения из InputFormat через объект конфигурации Hadoop
- 10. Создание пользовательского генератора Hadoop InputFormat без входных данных
- 11. Hadoop 2: Пустой результат при использовании пользовательского InputFormat
- 12. Hadoop InputFormat set Ключ к пути входного файла
- 13. Hadoop hive serde - Формат ввода должен реализовывать InputFormat
- 14. InputFormat Решение
- 15. Dumbo mapreduce for hadoop
- 16. pom.xml for Hadoop 2.6.0
- 17. Ozzie Inputformat MapReduce API
- 18. указав собственные inputformat для потоковой работы
- 19. Чтение файла excel на карте hadoop уменьшить
- 20. Free Hadoop Cluster for Experiments
- 21. hadoop ApplicationMaster ask for resource
- 22. настройка Java_home for in hadoop
- 23. Искры чтения файла WARC с пользовательским InputFormat
- 24. Невозможно найти пользовательский Hive InputFormat при использовании `where 1 = 1`
- 25. Spark: запустите InputFormat как singleton
- 26. XML Parse for excel
- 27. Цикл for excel
- 28. Open excel for writing
- 29. VBA for Excel Комментарии
- 30. Excel VBA Cycle For
Что такое прецедент? Это один входной файл? Что это за размер? Вы используете его в приложении excel или используете только формат? Работа с excel подходит для относительно небольших файлов Работа с hadoop подходит для очень больших наборов данных –
Мне нужно получить только один Excel-файл из HDFS. Размер файла - 1913 КБ. Мне нужно обработать этот файл в псевдораспределенном одномодовом кластере. –
Можем ли мы прочитать этот файл excel непосредственно из кластера hadoop. Каков тип inputformat, который мне нужно использовать в конфигурации Job –