Я пытаюсь использовать регулярное выражение, чтобы найти адрес прокси на веб-сайте. В настоящее время я использую этот кусок регулярного выражения (\d{1,3}\.){3}\d{1,3}:(\d+)
. Он работает на regexr.com и в возвышенном тексте, но когда я пытаюсь использовать его в Python, он работает не так, как ожидалось.Регулярное задание кортежа и неполное совпадение
Это кусок кода, я использую:
p = re.compile("(\d{1,3}\.){3}\d{1,3}:(\d+)")
ipCandidates = p.findall(soupString)
Он должен возвращать прокси как этот 120.206.182.172:8123
но он возвращает кортежи как этот ('44.', '3128')
. Что я могу сделать, чтобы исправить это?
спасибо.
Почему у вас есть группы захвата? Что вы ожидали от них? Если вы хотите не захватывать группы, это '(?: Stuff)', а не '(stuff)'. – user2357112
Честно говоря, я не знаю. Я нашел регулярное выражение онлайн, и он отлично работал во всем, кроме Python. Я не очень владею регулярным выражением. –