У меня проблема с регулярными выражениями на C#. Я хочу проанализировать html-код простой веб-страницы. Это выглядит следующим образом:C# анализ html-кода с помощью Regex
<td class="ivu_table_c_dep"> 12:05 </td>
<td class="ivu_table_c_line"> Bus 398 </td>
<td>
<img src="/IstAbfahrtzeiten/img/css/link.gif" alt="" />
<a class="catlink" href="http://mobil.bvg.de/Fahrinfo/bin/stboard.bin/dox?boardType=dep&input=S Mahlsdorf!&time=12:05&date=15.02.2012&&" title="interner Link: Information zu dieser Haltestelle">S Mahlsdorf</a>
То, что я хочу знать "12:05", "Автобус 398" и "S Mahlsdorf". В первых двух частях я заставляю его работать со следующим кодом:
Regex HTMLTag = new Regex("ivu_table_c_dep\">([^<>]*)</td>([^<>]*)<td class=\"ivu_table_c_line\">([^<>]*)</td>");
Но я не получаю 3. часть. Я пытался добавить "([^ (\">)] ) ([^ <>])»Но doesnt't работа
Обязательно: http://stackoverflow.com/questions/677038/how-to-use-regular-expressions-to -parse-html-in-java – Oded
Еще более обязательным: http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags –