Представьте следующую ситуацию: мы получаем XML-файл из какого-либо внешнего инструмента. В последнее время в этом XML, может быть некоторые убежали charakters в nodenames или в пределах их richcontent тега, как в следующем примере (simplyfied):Unmarshalling XML с JAXB без несуществующих символов
<map>
<node TEXT="Project">
<node TEXT="ää">
<richcontent TYPE="NOTE"><html>
<head>
</head>
<body>
<p>
I am a Note for Node ää!
</p>
</body>
</html>
</richcontent>
</node>
</node>
</map>
После демаршаллизации файла с JAXB этим уцелевшим charakters получить неэкранированное. К несчастью, мне нужно, чтобы они оставались такими, какими они есть, что означает бегство. Есть ли способ избежать отмены этих символов в то время, когда они не сортируются?
При исследовании я нашел много вопросов, касающихся сортировочных XML-файлы, где происходит противоположная проблема, но те не помогло мне либо:
Является ли это даже возможно ли достичь этой цели с помощью JAXB, или нам даже нужно рассмотреть возможность перехода на другой API-интерфейс xml?
Спасибо заранее, ymene
Для любого синтаксического анализа XML не имеет значения, является ли источник документ содержит 'ä', 'ä' или '& # xe4', почему это имеет значение в вашем случае? –
Проблема заключается в следующем: после импорта данных XML мы объединим его с нашими данными программы. Там мы изменим некоторые детали, а затем хотим записать эти данные обратно в xml для внешнего инструмента. Так как мы не создали еще один объектный график, чтобы просто вернуть данные в xml, мы обманули использование StAX, поскольку в это время это было просто проще. Так как до сих пор у нас никогда не было каких-либо экранированных символов, и к сожалению, внешний инструмент ожидает, что шаракеры еще не сработают. – crusam