У меня есть 46000 xml-файлов, которые имеют общую структуру, но есть вариации, а количество файлов делает невозможным вычисление общей схемы xml для всех из них. Есть ли инструмент, который может помочь мне извлечь схему из всех этих файлов или, по крайней мере, что-то, что может дать мне достаточно близкое представление о том, что является обязательным и что необязательно?извлечение XML-схемы (или эквивалента) из большого набора xml-файлов
Предпочтительно, конечно, схема в соответствии с некоторыми стандартами или DTD.
И, поскольку я полностью работаю в Linux, инструмент Linux или программа, работающая в Linux, в порядке. Я довольно свободно владею C, Java, Javascript, Groovy, Python (2.7 и 3) и несколькими другими языками.