2015-10-28 3 views
0

У меня есть следующие webpage:Получение внутреннего текста с HTML Agility обновления

enter image description here

Я пытаюсь захватить поля, которые имеют идентификаторы и имена классов:

 label = 
      node.SelectSingleNode(
       ".//h3[@class='item_header']" 
       ).InnerText.Replace("Label: ","").Trim(); 
     Console.WriteLine(label); 

Однако, я имею трудное время, пытаясь выяснить, как получить текст здесь:

enter image description here

Как вы анализируете текст в тегах, у которых нет идентификаторов или классов, например:

<b>Label Cat. #: WEST 3007/8</b> 

Если вообще полезно, здесь уникальный селектор:

#\31 42248 > tbody:nth-child(1) > tr:nth-child(1) > td:nth-child(1) > b:nth-child(1) 

ответ

0

У вас есть идентификатор таблицы. Вы можете просто пойти оттуда.

HtmlNodeCollection nodes = doc.DocumentNode.SelectNodes("//table[@id='142248']//b"); 

foreach (HtmlNode n in nodes) 
{ 
    if (n.InnerText.ToLower().Contains("label")) 
    { 
     Console.WriteLine(n.InnerText); 
    } 
} 

XPath в приведенном выше коде дает все в таблице с идентификатором 142248.

Смежные вопросы