У меня есть длинный текст, и я хотел бы получить все записи в тексте, которые соответствуют следующей схеме:регулярное выражение HTTP в Python
HTTP * * **** .id.txt , где * может быть любая запись (неизвестная длина), а точки - это фактически точки в тексте. Я хотел бы иметь список со всеми элементами, которые соответствуют такому шаблону.
Одна из многих попыток был,
c = re.match(r'^(http)(.*)id.txt', b)
Я также попытался,
c = re.findall(r'(http)(.*)fastq.gz', b)
, но ни один из них не дают список HTTP * * * .fastq.gz записей.
Спасибо!
Что вы имеете в виде, когда вы скажем, «это не работает» –
Я имею в виду, что это не дает мне список, который я хочу. – Dnaiel
Я сильно подозреваю, что вы можете быть более точным, если вы говорите, что * может быть «любой записью». Возможно, это может быть любое количество символов без пробелов (например, r '(http \ S *) ", или это может быть любое число любого символа, отличного от некоторых битов пунктуации (r'http [^.,; \ T \ n] * '). Будь более конкретным о том, как вы узнали, что попали в конец одной из этих строк, а затем выясните, как представить это как атомы регулярного выражения. –