2010-04-14 6 views

ответ

1

Использование регулярных выражений.

String result = Regex.Replace(your_text_goes_here, @"<[^>]*>", String.Empty); 
+0

@sashaeve: Это не достаточно надежный инструмент для визуализации HTML – James

+1

@James: Почему бы и нет? Все зависит от того, какая сложность HTML будет использоваться в качестве источника. Если такого простого, как в примере, этого будет достаточно. – sashaeve

+0

Да, может быть, так (как я сам предложил), однако я предполагаю, что HTML будет немного сложнее, чем то, что было представлено в этом примере. – James

3

Я бы предложил попробовать на HTML Agility обновления для .NET:

Html Agility Pack - Codeplex

Attemtping разобрать через HTML с что-нибудь еще, по большей части, ненадежной.

бы вы ни делали, DON'T TRY TO PARSE HTML WITH REGEX!

+0

Я думаю, что HtmlAgilityPack не требуется для этой простой задачи. См. Мой ответ. – sashaeve

+0

@sashaeve И посмотрите мой обновленный ответ. Для простого примера вроде этого RegEx может работать ... но это всего лишь пример. Моя догадка заключается в том, что его реальная проблема намного сложнее и что сообщение SO объясняет IN DEPTH, почему вы не можете анализировать HTML с помощью RegEx. –

+0

Согласен с вами. – sashaeve

0

Вам нужно будет использовать какой-либо HTML-парсер. Вы можете использовать существующий Regex или создать свой собственный. Однако они не всегда на 100% надежны. Я хотел бы предложить использовать утилиту 3 участника как HtmlAgilityPack (я использовал этот и будет рекомендовать его)

0

бедняка HTML Parser

 string s = 
      @" 
      <html> 
      <body> 
      <h1>My First Heading</h1> 
      <p>My first paragraph.</p> 
      </body> 
      </html> 
     "; 

     foreach (var item in s.Split(new char[]{'<'})) 
     { 
      int x = item.IndexOf('>'); 

      if (x != -1) 
      { 
       Console.WriteLine(item.Substring(x).Trim('>')); 
      } 
     }