У меня возникают трудности с использованием выражения лямбда для анализа таблицы html.Извлечение таблицы с использованием Htmlagilitypack + LINQ + Lambda
var cells = htmlDoc.DocumentNode
.SelectNodes("//table[@class='data stats']/tbody/tr")
.Select(node => new { playerRank = node.InnerText.Trim()})
.ToList();
foreach (var cell in cells)
{
Console.WriteLine("Rank: " + cell.playerRank);
Console.WriteLine();
}
Я хотел бы продолжать использовать синтаксис
.Select(node => new { playerRank = node.InnerText.Trim()
, но и для других категорий таблицы, такие как имя игрока, команда, положение и т.д., я использую Xpath, так Я не уверен, правильно ли это.
У меня возникли проблемы выяснить, как извлечь ссылку + имя игрока из:
<a href="/ice/player.htm?id=8474564">Steven Stamkos</a>
Xpath для него является:
//*[@id="fullPage"]/div[3]/table/tbody/tr[1]/td[2]/a
Может кто-нибудь помочь?
EDIT * добавлена HTML-страница. http://www.nhl.com/ice/playerstats.htm?navid=nav-sts-indiv#
Просьба указать ссылку на страницу, которую вы пытаетесь очистить. – broke
Я добавил страницу, которую я пытаюсь очистить. –