2010-03-09 2 views
2

Можно ли проанализировать таблицы html, указав только имя столбца?Анализ или извлечение содержимого таблицы html

Как только эти данные должны быть извлечены из таблицы, которая соответствует этим именам столбцов, которые я даю.

Как, например, у меня есть таблица имен столбцов, как серийный номер., Имя, адрес, телефон, всего Rs ..

И я хочу, чтобы извлечь информацию только об имени, телефона нет и общего Rs. Тогда как я могу это сделать?

+0

У вас есть таблица html в winform? – Saar

+0

Не могли бы вы привести пример того, что вы пробовали? – btlog

+0

У вас есть доступ к HTML, а не к базовым данным? По крайней мере, вы не спросили, как это сделать с помощью регулярных выражений ... –

ответ

3

Посмотрите на Html Agility Pack Он предоставляет LINQ api для поиска содержимого html.

+0

+1 для Html Agility Pack –

2

Да, вы можете. Вы можете использовать XPATH для сканирования html-документа (google для очистки экрана). Другой метод - это интерфейсы тестирования UI, такие как Watin, которые позволяют использовать селектор CSS и многое другое для поиска элементов на странице HTML и получения содержимого.

+0

+1 хороший ответ :) – Saar

+0

@DarkwingDuck XPATH? Это класс или что-то еще, встроенное в .net? – Harikrishna

+0

@DarkWingDuck Через то, что будут извлечены только эти данные, для которых я дам ввод имен столбцов ?. – Harikrishna

1

Вы можете использовать Data Extracting SDK, который имеет HtmlProcessor класс с Таблицы собственности, который обрабатывает HTML-таблицы как DataTable объектов.

Смежные вопросы