Я хочу знать, есть ли какой-либо инструмент, который я могу использовать для анализа XML-файлов в hadoop. Я знаю, используя сокращение карты, мы можем анализировать XML-файлы, если нет доступных инструментов, чем лучше разбираться в языке scala, java или pig? Пожалуйста, помогите.Инструмент для анализа XML в Hadoop
ответ
В среде hadoop обычно имеется Java. Поэтому я бы использовал «Java Architecture for XML Binding» или JAXB.
Это сравнительно проста в использовании и имеет стратегии развития, которые включают в себя основные подходы:
- У вас есть XML, что кто-то определил, что вы хотите получить доступ в Java.
- У вас есть структуры данных Java, которые вы хотите представлять в XML.
У этого есть много особенностей, но не беспокойтесь о том, чтобы добавить все колокола и свистки, если они вам не нужны. Это также достаточно быстро.
You can find the learning path for it here.
Scala также является отличным выбором, но он немного страдает от более высокой кривой обучения (что не так уж важно, если вы уже знаете Java и подвергаетесь воздействию языков на основе лямбда). Документация является разумной, но иногда она просто отстает от документации, доступной для Java.
Scala будет моим вторым выбором для команды, у которой не было послужной список доставки в Скала. Это не сложнее, и для некоторых проблем Scala намного проще, но без небольшого количества опыта Scala, как правило, решаются проблемы в Scala, использующих подходы, отличные от Scala.
Свинья - это язык, с которым у меня был ограниченный опыт, поэтому я буду оставлять комментарии.
- 1. Мне нужен инструмент для анализа журнала Hadoop
- 2. Инструмент для анализа SVN
- 3. Инструмент для анализа исходного кода?
- 4. Инструмент для анализа nginx log
- 5. Инструмент анализа исключений для C++
- 6. Использование hadoop для анализа данных
- 7. Инструмент GCC для анализа размера?
- 8. инструмент для анализа журналов log4net
- 9. Инструмент анализа/анализа журналов Python
- 10. Инструменты для анализа Hadoop Network Bandwith потребление
- 11. Как создать инструмент с использованием C++ для анализа XML-файлов
- 12. Ваш любимый инструмент для анализа удара
- 13. Хороший инструмент для индексирования и анализа документов?
- 14. Инструмент анализа памяти
- 15. Инструмент анализа архитектуры Lattix
- 16. Инструмент интерактивного статистического анализа
- 17. Инструмент анализа запросов
- 18. Инструмент анализа использования кода
- 19. инструмент анализа журналов для анализа данных для временного окна
- 20. Инструмент для анализа потоков для ios
- 21. require.js инструмент анализа зависимости
- 22. Любой инструмент для простого анализа файла конфигурации в Linux?
- 23. Как использовать инструмент percona для анализа и анализа двоичных журналов?
- 24. Инструмент для анализа больших дампов кучи Java
- 25. Инструмент для инкрементного статического анализа кода?
- 26. Инструмент для анализа исходных текстов Matlab
- 27. SAP hana прогностический инструмент для анализа
- 28. Необходимый инструмент для автоматического анализа аварийных сообщений
- 29. Инструмент для анализа сетевого трафика настраиваемого протокола
- 30. Инструмент, необходимый для анализа статического кода
Если размер файла xml огромен, чем синтаксический анализ будет проще с помощью JAXB? – animal
есть ли инструмент для синтаксического анализа xml? – animal
JAXB - это инструмент для анализа Java. Он может обрабатывать XML-файлы с разумным размером; но если вы действительно говорите о массивных файлах XML, вы можете захотеть использовать меньший компонент инструментов анализа XML XML, называемый SAX. Первичная оптимизация SAX предлагает следующее: когда ваш XML настолько велик, вы не можете хранить его в памяти вашей программы, вы можете более легко пропустить части XML, которые вам не нужны. Это пропущение может быть сделано в обоих наборах инструментов, но SAX настолько примитивен, что легче сгибать его для обработки нечетных сценариев (по крайней мере для меня); но если вы это сделаете, рассматривайте его как часть синтаксического анализа. –