Я пытаюсь проанализировать некоторые данные с сайта, чтобы получить конкретные элементы из их таблиц. Я знаю, что любой тег с атрибутом bgcolor, установленным на #ffffff или # f4f4ff, - это то, где я хочу начать, и мои фактические данные находятся во втором в этом.Анализ HTML с помощью VB DOTNET
В настоящее время у меня есть:
Private Sub runForm()
Dim theElementCollection As HtmlElementCollection = WebBrowser1.Document.GetElementsByTagName("TR")
For Each curElement As HtmlElement In theElementCollection
Dim controlValue As String = curElement.GetAttribute("bgcolor").ToString
MsgBox(controlValue)
If controlValue.Equals("#f4f4ff") Or controlValue.Equals("#ffffff") Then
End If
Next
End Sub
Этот код получает элемент TR, что мне нужно, но я понятия не имею, как (если это возможно), чтобы затем исследовать внутренние элементы. Если нет, как вы думаете, лучший маршрут? Сайт на самом деле не помещает ни одну из своих таблиц. «S я ищу в основном выглядеть следующим образом:
<td><b><font size="2"><a href="/movie/?id=movieTitle.htm">The Movie</a></font></b></td>
Я хочу, чтобы вытащить„The Movie“текст и добавить его в текстовый файл.
Спасибо! Очень полезно. Моя единственная проблема в том, что я все еще один уровень слишком высок. Я получаю все элементы
См. 'UPDATE:' в моем ответе. –
Это сработало отлично. Используя Dim elementValue As String = secondChildElement.InnerText, а не InnerHtml, мне удалось извлечь текст «The Movie» так же, как мне нужно. Я бы голосовал как полезный, но поскольку я должен был создать новую учетную запись, я пока не могу. Ха-ха. Хорошего дня! – Ooglybooglies
Смежные вопросы