2012-12-01 2 views
-2

Можно создать дубликат:
Getting text between all tags in a given html and recursively going through linksДобывающих слова между всеми тегами в HTML C#

как я могу использовать ловкость пакет, чтобы вытащить слова и информации между тегами? я просто игнорирую все теги в своем html-коде и получаю все слова между этими тегами. Код html был сохранен мной в строке! теперь я хочу использовать пакет гибкости, чтобы выполнить это?

+0

это похоже на предыдущий question..you должны улучшить свой предыдущий вопрос и иметь терпение для получения ответов ... – Anirudha

+0

, что один не упоминает ловкость пакета, который почему я сделал новый вопрос! это о пакете гибкости! я читал и слышал его лучше, чем выражение reg! это то, что я хочу знать, как можно выполнить мою работу через пакет гибкости? – haris

ответ

0

Ну,

все зависит от. Если, например, у одного тега есть класс, и он уникален - это одна функция, но если есть несколько тегов, вам нужно подумать и создать свою функцию на основе расположения тегов, в другой ситуации, когда нет тегов, и вы бы должны подсчитывать элементы html; вам также может потребоваться циклическое перемещение по строкам tabe.

Пример ниже делает то же, что вам нужно. (не уверен, что он все еще работает, так как если бы произошла смена макета страницы, это может закончиться ошибкой.) Но это дает идею, и вы можете идти оттуда.

PS - при задании вопросов задайте точную проблему, а не расплывчатые объяснения.

   String openUrl = @"http://www.ebay.com/sch/-/11724/i.html?_nkw=" + some_part_number + "&_armrs=1&LH_Complete=1"; 

       HtmlWeb hw = new HtmlWeb(); 
       hw.UserAgent = "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)"; 
       HtmlAgilityPack.HtmlDocument doc = hw.Load(openUrl); 

       foreach (HtmlNode nd in doc.DocumentNode.SelectNodes("//tr[@itemprop='offers']")) 
       { 
        String title = ""; 
        title = Regex.Split(nd.InnerHtml.ToString(), ("title='"))[1].Trim(); 
        title = Regex.Split(title, "'")[0].Trim(); 
       } 
Смежные вопросы