Я пытаюсь создать новостной агент, чтобы получить новости из websites.so я должен использовать html parser
как HtmlAgilityPack
.so здесь ча увидеть мой код:Получить HREF InnerText с HtmlAgilityPack
public async void parsing(string website)
{
HttpClient http = new HttpClient();
var response = await http.GetByteArrayAsync(website);
String source = Encoding.GetEncoding("utf-8").GetString(response, 0, response.Length - 1);
source = WebUtility.HtmlDecode(source);
HtmlDocument resultat = new HtmlDocument();
resultat.LoadHtml(source);
List<HtmlNode> toftitle = resultat.DocumentNode.Descendants().Where
(x => (x.Name == "div" && x.Attributes["class"] != null && x.Attributes["class"].Value.Contains("latest-news"))).ToList();
var li = toftitle[0].Descendants("li").ToList();
foreach (var item in li)
{
var link = item.Descendants("a").ToList()[0].GetAttributeValue("href", null);
var img = item.Descendants("img").ToList()[0].GetAttributeValue("src", null);
}
}
вот мой HTML-код, который должен быть проанализирован:
<a href="/news?p_p_id=56_INSTANCE_tVzMoLp4zfGh&_56_INSTANCE_tVzMoLp4zfGh_mode=news&_56_INSTANCE_tVzMoLp4zfGh_newsId=3153832&p_p_state=maximized">› پانل «بررسي سازوکارهاي تأمين منابع مالي براي توسعۀ فناوري» بهعنوان پانل برتر پنجمين کنفرانس بينالمللي و نهمين کنفرانس ملي مديريت فناوري معرفي شد</a>
<a href="/news?p_p_id=56_INSTANCE_tVzMoLp4zfGh&_56_INSTANCE_tVzMoLp4zfGh_mode=news&_56_INSTANCE_tVzMoLp4zfGh_newsId=3135970&p_p_state=maximized">› فرآیند و فرم درخواست استفاده از تسهیلات حمایتی بلاعوض صندوق نوآوری و شکوفایی جهت حضور شرکت های دانش بنیان در جایزه ملی مدیریت فناوری و نوآوری</a>
Так что проблема я могу получить href link
но не href value
.Я имею в виду я могу получить URL новости, но не название پانل «بررسي سازوکارهاي تأمين منابع مالي براي توسعۀ فناوري» بهعنوان پانل برتر پنجمين کنفرانس بينالمللي و نهمين کنفرانس ملي مديريت فناوري معرفي شد
.
Как я могу это получить?
Существует только одно значение для href, ссылка. «Заголовок», который вы хотите, является внутренним текстом элемента a. –
@SamiKuhmonen так как я могу получить этот внутренний текст? –
@SamiKuhmonen Я редактирую сообщение, я просто добавил один из элементов li –