Итак, мне нужно запросить веб-сайт в реальном времени, чтобы получить данные из таблицы, поместите эту таблицу HTML в DataTable и затем используйте эти данные. До сих пор мне удалось использовать Html Agility Pack и XPath для доступа к каждой строке в таблице, в которой я нуждаюсь, но я знаю, что должен быть способ проанализировать ее в DataTable. (C#) Код Сейчас я использую это:Получение данных из таблицы HTML в datatable
string htmlCode = "";
using (WebClient client = new WebClient())
{
htmlCode = client.DownloadString("http://www.website.com");
}
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(htmlCode);
//My attempt at LINQ to solve the issue (not sure where to go from here)
var myTable = doc.DocumentNode
.Descendants("table")
.Where(t =>t.Attributes["summary"].Value == "Table One")
.FirstOrDefault();
//Finds all the odd rows (which are the ones I actually need but would prefer a
//DataTable containing all the rows!
foreach (HtmlNode cell in doc.DocumentNode.SelectNodes("//tr[@class='odd']/td"))
{
string test = cell.InnerText;
//Have not gone further than this yet!
}
HTML-таблицы на сайте я запрашивающие выглядит следующим образом:
<table summary="Table One">
<tbody>
<tr class="odd">
<td>Some Text</td>
<td>Some Value</td>
</tr>
<tr class="even">
<td>Some Text1</td>
<td>Some Value1</td>
</tr>
<tr class="odd">
<td>Some Text2</td>
<td>Some Value2</td>
</tr>
<tr class="even">
<td>Some Text3</td>
<td>Some Value3</td>
</tr>
<tr class="odd">
<td>Some Text4</td>
<td>Some Value4</td>
</tr>
</tbody>
</table>
Я не уверен, будет ли лучше/легче используйте LINQ + HAP или XPath + HAP, чтобы получить желаемый результат, я пробовал работать с ограниченным успехом, как вы, вероятно, видите. Это первый раз, когда я когда-либо делал программу для запроса веб-сайта или даже взаимодействовал с веб-сайтом каким-либо образом, поэтому я очень не уверен в данный момент! Спасибо за любую помощь заранее :)
это помогает? http://weblogs.asp.net/grantbarrington/archive/2009/10/15/screen-scraping-in-c.aspx – iwayneo