... специально XA3 (& фунт, & # XA3, & # 163)фильтр определенных символов Юникода из XML
я загружаю несколько долго XML документов и периодически, я побегу в тот, который выиграл tt, исключая исключение:
Недопустимый символ в данной кодировке. Строка x, позиция y.
Вот код в вопросе:
var doc = new XmlDocument();
doc.Load(file.FullName);
Когда я смотрю на данный документ на линии указано, я вижу XA3 отформатированный обратно (черный Б.Г., белый фг) в одном из теги XML.
Заголовок каждого файла XML нет ничего примечательного:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
Это может звучать как действительно немой вопрос, но есть ли способ, чтобы либо удалить оскорбительный характер или сказать XMLDocument, который считывает файл принять кодировку символов?
Взгляните на [Исключить недопустимые символы XML в C#] (https://stackoverflow.com/questions/8331119/escape-invalid-xml-characters-in-c-sharp) и [Сегментация XML (de) недействительна строка несовместима в C#?] (https://stackoverflow.com/questions/13450117). При этом '& # xa3' является вполне допустимым символом XML. Можете ли вы дать [mcve], как возникло это исключение? – dbc