Я пытаюсь использовать шаблоны re в scrapy для синтаксического анализа строки. Строка имеет следующий формат. Я пытаюсь получить номера в тегах шрифтов (например, 08:00
). Достаточно легко сделать в одном списке (\d+:\d+)+
, но мне нужны два отдельных списка: AM
и PM
. Можете ли вы сделать это, создав две подстроки - AM
и PM
- а затем запустив узор против каждой из подстрок? (AM -
и (PM -
являются уникальными. Похоже, вы должны быть способны сделать это напрямую, но у меня нет идей. Благодарю.Python re string parsing
Пример ввода:
(AM – 07:00 <font color=#0002fe>08:00</font> <font color=#0000dd>09:00</font> <font color=#0001fe>10:100</font>) <br> (PM – 18:00 <font color=#0000fe>190:00</font> <font color=#0000fe>175:00</font>)
Спасибо за ваши ответы. Боюсь, я не был достаточно ясен в своем оригинальном посте. Строка, представленная, является образцом, но является частью более крупной строки, которая содержит много других тегов inc.
теги, так что расщепление на тегах по предложению не является вариантом. Что касается BeautifulSoup, я не использовал его, поэтому считаю, что для меня просто проще использовать re, чтобы извлечь два раздела в подстроки и проанализировать их, как указано. Еще раз спасибо. – john