Я разбираю некоторые html с помощью регулярных выражений, и я хочу совместить строки, начинающиеся со слова без каких-либо тэгов html, а также удаление пробела. Использование C# Regex мой первый рисунок был:regex: совпадающие фразы без> или пробела
pattern = @"^\s*([^<])";
, который пытается захватить все белое пространство, а затем захватить любые не «<» символов. К сожалению, если линия имеет все пробелы перед первым «<», это возвращает последний символ пробела перед «<». Я бы хотел, чтобы это провалило матч.
Любые идеи?
Могу ли я обратиться к [моему ответу] (http://stackoverflow.com/questions/792679/need-help-writing-regular-expression-html-parsing/792686#792686) к другому аналогичному вопросу? –
Разбор HTML обсуждался много. См. Этот пост: [Использование регулярных выражений для разбора HTML: почему бы и нет?] (Http://stackoverflow.com/questions/590747/using-regular-expressions-to-parse-html-why-not) –