3
Я пытаюсь использовать пакет гибкости HTML, чтобы моя программа читалась в файле и извлекала из него все изображения srcs. Вот что я получил до сих пор:C# с использованием html agility pack URI форматы не поддерживаются
private ArrayList GetImageLinks(String html,String link)
{
//link = url of webpage
//html = a string of the html, just for testing will remove after
HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();
htmlDoc.OptionFixNestedTags = true;
htmlDoc.Load(link);
List<String> imgs = (from x in htmlDoc.DocumentNode.Descendants()
where x.Name.ToLower() == "img"
select x.Attributes["src"].Value).ToList<String>();
Console.Out.WriteLine("Hey");
ArrayList imageLinks = new ArrayList(imgs);
foreach (String element in imageLinks)
{
Console.WriteLine(element);
}
return imageLinks;
}
И это им ошибка при получении: System.ArgumentException: URI форматы не поддерживаются.
Это ошибка на линии нагрузки? [** Если это так, вы должны загрузить контент, а затем загрузить его там, как этот ответ. **] (http://stackoverflow.com/a/10558196/342740) – Prix
namespace HtmlWeb не найден? – R00059159
https://github.com/jstedfast/HtmlAgilityPack/blob/master/HtmlAgilityPack/HtmlWeb.Xpath.cs – Prix