Большинство синтаксических анализаторов XML будут сдаваться после первой ошибки в документе. Фактически, IIRC, это фактически часть «официальной» спецификации для парсеров.Отчет о проверке XML-парсера
Я ищу что-то, что нарушит это правило. Он должен принять заданную схему (предполагая действительную схему) и вход xml и попытаться продолжить работу после первой ошибки и либо поднять событие для каждой ошибки, либо вернуть список, когда закончите, так что я могу использовать его для создания какой-либо отчет об ошибках в документе. Это требование приходит сверху, поэтому давайте попробуем сохранить пуриста «но было бы бессмысленно продолжать» комментариев к минимуму.
Я ищу что-то, что будет оценивать, правильно ли сформирован документ и независимо от того, соответствует ли он схеме. В идеале это оценило бы их как разные классы ошибок. Я бы предпочел решение .NET, но я мог бы использовать автономный .exe. Если вы знаете, что использует другую платформу, отправляйте ее, потому что кто-то может найти ее полезной.
Update:
Я ожидаю, что большинство документов, где я использую это будет основном хорошо сформирован. Возможно, & в качестве данных вместо & amp здесь и там, или случайный неправильно размещенный тег. Я не ожидаю, что синтаксический анализатор сможет оправиться от всего, просто чтобы приложить все усилия, чтобы продолжать идти. Если документ слишком избит, он должен выплевывать столько, сколько может последовать какой-то «фатальной, неспособной продолжить» ошибку. В противном случае часть проверки схемы довольно проста.