Я просто ищу простой способ очистки некоторых HTML (возможно, с помощью встроенного кода JavaScript). Я пробовал twodifferentHTML Tidy. NET-порты и оба исключают исключение ...C# версия HTML Tidy?
Извините, по словам «чистый» я имею в виду «отступ». HTML совсем не искажен. Это XHTML строгий.
Я наконец получил что-то работает с SGML, но это серьезно самый смешной кусок кода, когда-либо отступов некоторые HTML.
private static string FormatHtml(string input)
{
var sgml = new SgmlReader {DocType = "HTML", InputStream = new StringReader(input)};
using (var sw = new StringWriter())
using (var xw = new XmlTextWriter(sw) { Indentation = 2, Formatting = Formatting.Indented })
{
sgml.Read();
while (!sgml.EOF)
xw.WriteNode(sgml, true);
}
return sw.ToString();
}
Таким образом, вы просто хотите переформатировать исходный код? Для этого вы можете использовать любой веб-идеал или Notepad ++. –
@Nick: Я понимаю это, но я не пытаюсь переформатировать HTML-файлы, которые у меня уже есть. Я пытаюсь переформатировать HTML, который я генерирую в приложении C# ... – mpen
проверить HtmlTextWriter, я обновил свой ответ –