Получение внутреннего текста с HTML Agility обновления

У меня есть следующие webpage:Получение внутреннего текста с HTML Agility обновления

Я пытаюсь захватить поля, которые имеют идентификаторы и имена классов:

 label = 
      node.SelectSingleNode(
       ".//h3[@class='item_header']" 
       ).InnerText.Replace("Label: ","").Trim(); 
     Console.WriteLine(label);

Однако, я имею трудное время, пытаясь выяснить, как получить текст здесь:

Как вы анализируете текст в тегах, у которых нет идентификаторов или классов, например:

<b>Label Cat. #: WEST 3007/8</b>

Если вообще полезно, здесь уникальный селектор:

#\31 42248 > tbody:nth-child(1) > tr:nth-child(1) > td:nth-child(1) > b:nth-child(1)

источник

2015-10-28 l--' ' ' ' ' ' ---------' ' ' ' ' ' ' ' ' ' ' '

HTML-Agility пакет имеет Selector библиотеку компаньон CSS, где вы могли бы использовать селектор в вашем вопросе, чтобы найти элемент.

https://www.nuget.org/packages/HtmlAgilityPack.CssSelectors/

источник

2015-10-28 01:37:13

Это потрясающе !! –

У вас есть идентификатор таблицы. Вы можете просто пойти оттуда.

HtmlNodeCollection nodes = doc.DocumentNode.SelectNodes("//table[@id='142248']//b"); 

foreach (HtmlNode n in nodes) 
{ 
    if (n.InnerText.ToLower().Contains("label")) 
    { 
     Console.WriteLine(n.InnerText); 
    } 
}

XPath в приведенном выше коде дает все в таблице с идентификатором 142248.

источник

2015-11-09 23:50:48

Получение внутреннего текста с HTML Agility обновления

ответ

Смежные вопросы