2011-08-08 2 views
-1

Как я могу захватить текст ТОЛЬКО с сайта html, но только текст, а не html?захватить ТОЛЬКО ТОЛЬКО с сайта

я хочу, чтобы захватить этот сайт

http://kramansro.net/lunia/sites.html

я использовал этот код

TextBox1.Text = WebBrowser2.DocumentText 

Но когда я захватить его это выходит как этот

sdfasdfad<br>asdfasdfa<br>dfasdf<br>aasd<br>fs<br>dfa<br>sdf<br>asdf<br>asd<br>f<br>as 

Но я хочу это должно быть следующим:

sdfasdfad 
asdfasdfa 
dfasdf 
aasd 
fs 
dfa 
sdf 
asdf 
asd 
f 
as 
+0

Посмотрите здесь http://stackoverflow.com/questions/181095/regular-expression-to-extract-text-from-html – Im0rtality

ответ

0

Ну, самый простой способ для этого конкретного случая использования будет

TextBox1.Text = WebBrowser2.DocumentText.Replace("<br>", vbCrLf); 

Если у вас есть более сложный HTML, вы должны смотреть в Regular Expressions.

+0

Нет, мой html - это то, что вы видите выше –

+0

Хорошо, что было легко тогда :) Удачи. – Jordan

+0

Джордан Это не было ничего не изменило любую вещь TextBox1.Text = WebBrowser2.DocumentText WebBrowser2.DocumentText.Replace («
», vbCrLf) –

Смежные вопросы