<a class="support" style="letter-spacing: -1px" href="/support/index.php?/Knowledgebase/List/updates" data-executing="0">I'm random</a>
Я пытаюсь очистить указанный атрибут ссылки с помощью xpath, текст ссылки "I'm random"
всегда меняется. Остальное остается прежним. Текст "I'm random"
- это то, что я ищу, чтобы царапать.Xpath Web scrape
Я действительно не понимаю xpath, Как бы я потянул только внутренний текст? Я пробовал:
string html = Web.ExecuteJavascriptWithResult("document.getElementsByTagName('html')[0].innerHTML");
var htmlDoc = new HtmlAgilityPack.HtmlDocument();
htmlDoc.LoadHtml(html);
var Attributes = new List<string>();
var Randomtxt = htmlDoc.DocumentNode.SelectNodes("//a[@href]");
if (Randomtxt != null)
{
foreach (var contents in Randomtxt)
{
string href = contents.InnerHtml;
var parts = href.Split(new char[] { '=' }, StringSplitOptions.RemoveEmptyEntries);
if (parts.Length > 1)
{
Attributes.Add(parts[1]);
}
}
Attribute.DataSource = Attributes;
}
Но он ничего не возвращает. Как мне получить только внутренний текст.
[ссылка:] (http://nyqui.st/parsing-html-in-c) 'htmlDoc.DocumentNode.SelectNodes ("// а [@href]")', то для каждого узла , вызовите 'node.InnerHtml'. – kennyzx
Объясните определяющие характеристики ссылки, которую вы хотите получить. Есть ли какие-либо, кроме «имеет« href »? (Кроме того, XPath не очень сложно. Вы пытались забрать его в течение нескольких часов или сразу же отказались?) – Tomalak
Я только начинаю, часть, которую я хочу, это случайный текст. Мне не нужна ссылка href. Только текст, который сгенерирован – user3674312