2013-11-25 2 views
3

Я пытаюсь использовать пакет гибкости HTML, чтобы моя программа читалась в файле и извлекала из него все изображения srcs. Вот что я получил до сих пор:C# с использованием html agility pack URI форматы не поддерживаются

private ArrayList GetImageLinks(String html,String link) 
    { 
     //link = url of webpage 
     //html = a string of the html, just for testing will remove after 

     HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument(); 
     htmlDoc.OptionFixNestedTags = true; 
     htmlDoc.Load(link); 
     List<String> imgs = (from x in htmlDoc.DocumentNode.Descendants() 
          where x.Name.ToLower() == "img" 
          select x.Attributes["src"].Value).ToList<String>(); 

     Console.Out.WriteLine("Hey"); 
     ArrayList imageLinks = new ArrayList(imgs); 


     foreach (String element in imageLinks) 
     { 
      Console.WriteLine(element); 

     } 

     return imageLinks; 
    } 

И это им ошибка при получении: System.ArgumentException: URI форматы не поддерживаются.

+1

Это ошибка на линии нагрузки? [** Если это так, вы должны загрузить контент, а затем загрузить его там, как этот ответ. **] (http://stackoverflow.com/a/10558196/342740) – Prix

+0

namespace HtmlWeb не найден? – R00059159

+0

https://github.com/jstedfast/HtmlAgilityPack/blob/master/HtmlAgilityPack/HtmlWeb.Xpath.cs – Prix

ответ