2016-09-13 3 views
0

мне нужно, чтобы очистить каждый профиль HREF ссылки из:скоблить ссылки с использованием HtmlAgilityPack

<div class="avatar" style="height:85px; float: left; margin: 7px 0 7px 14px;"> 
     <span style="font-size: 8px">04.09.16 10:22:42</span> 
     <br> 
     <a href="/Profile/user_3383.html" alt="example" title="example"> 

    <img src="http://example.com/noimg.gif" alt="example" class="avatar"> 
     exampleNick 
     </a> 
    </div> 

Так что я хочу получить: /Profile/user_3383.html

Что мне удалось это:

HtmlUsers.LoadHtml(getRequest("http://example.com/users.html", cookieJar(30))) 

       Dim getLink = HtmlUsers.DocumentNode.SelectNodes("//div[@class='avatar']/a/@href") 

       For Each profileLink As HtmlAgilityPack.HtmlNode In getLink 
        ListBox11.Items.Add(profileLink.InnerHtml) 
       Next 

Но то, что я получить:

<img src="http://example.com/noimg.gif" alt="example" class="avatar"> exampleNick 

У вас есть идеи, почему это не дает мне профиль href?

ответ

0

Вы можете выбрать <a> элементы первого, а затем добавить href атрибут из каждого <a> к ListBox:

Dim getLink = HtmlUsers.DocumentNode.SelectNodes("//div[@class='avatar']/a[@href]") 

For Each profileLink As HtmlAgilityPack.HtmlNode In getLink 
    ListBox11.Items.Add(profileLink.GetAttributeValue("href", "")) 
Next 
+0

Спасибо, это работает. Мой код был интуитивно понятным, и я все равно не понимаю, почему он не работает. Он работал правильно с использованием этого сайта: http://videlibri.sourceforge.net/cgi-bin/xidelcgi –

Смежные вопросы