Regex новичок здесь. У меня есть куча URL-адресов, из которых мне нужно извлечь некоторые подстроки, для которых я использую регулярное выражение.Извлечение подстроки из URL с использованием regex
Ех: Если мой URL-адрес https://chrome.google.com/webstore/detail/vt-hokie-stone-theme/enmbbbhbkojhbkbolmfgbmlcgpkjjlja?hl=en-US
, мне нужно извлечь часть 1. vt-hokie-stone-theme
и 2. enmbbbhbkojhbkbolmfgbmlcgpkjjlja
часть этого URL-адреса на две отдельные переменные.
Начальная часть моего URL всегда остается постоянной, поэтому я построил следующее регулярное выражение detail\/([a-z0-9\-]+)\/([a-z]+)
, и я пытаюсь Мах на http://www.pythonregex.com/
Я вижу, что regex.findall(string)
дает мне то, что я хочу, но у меня есть следующие вопросы:
Я хочу, чтобы они были в двух отдельных переменных, вместо того, чтобы иметь их как формат списка в одной переменной. Как мне это сделать?
Кроме того, при проверке на pythonregex команда
regex.findall(string)
дает результат как[(u'vt-hokie-stone-theme', u'enmbbbhbkojhbkbolmfgbmlcgpkjjlja')]
. Я понимаю, что предыдущийu
означает unicode, но я не хочу этого в своем выходе. Как его удалить?
Это сломается, если регулярное выражение не совпадает. – michaelmeyer
Спасибо, что заметили. Отредактировал ответ для обработки исключения в случае, если регулярное выражение не совпадает. –
Спасибо, это полезно! :) – TheRookierLearner