При попытке использовать XMLWorkerHelper.GetInstance(). ParseXHTML() я считаю, что он действительно строгий. Любой неправильный порядок тегов или закрытых тегов заставит его исключать исключение., обрабатывающий itextsharp XMLWorkerHelper.ParseXHTML строгое поведение
Я конвертирую HTML, который я не контролирую.
Есть ли какие-либо флаги, чтобы сделать его менее строгим? Интерфейс обратного вызова для обработки смешной разметки? Что-нибудь в itextsharp.tools.xml.html? Или полностью новая библиотека, совместимая с itextsharp.text.IElement?
Спасибо Крис. До сих пор я не смотрел HTML Tidy и HTMLAgilityPack. Огромное узкое место здесь. – Jake
@ Jake, я обновил свой ответ с помощью другого инструмента, чтобы попробовать –