Я хочу прочитать текст сайта без html-тегов и заголовков. Мне просто нужен текст, отображаемый в веб-браузере.Как читать содержимое веб-сайта в C#?
мне не нужно, как этот
<html>
<body>
bla bla </td><td>
bla bla
<body>
<html>
я просто нужно текст «бла-бла-бла-бла».
Я использовал методы webclient и httpwebrequest для получения содержимого HTML и разделения полученных данных, но это невозможно, потому что, если я изменю сайт, теги могут измениться.
Итак, можно ли каким-либо образом получить только отображаемый текст на веб-сайте?
Я думаю, что вы будете нуждаться в HTML-парсер, и если у вас есть контроль исходного кода страницы, чтобы добавить идентификатор элемент, который вы хотите получить, чтобы получить его с помощью метода getElementById анализатора. – alfoks
@alfoks :: У вас есть ссылка на пример для парсера HTML? –