и как обычно заблаговременно.Java regEx URL соответствует выпуск
Я пытаюсь ознакомиться с regEx и у меня проблема с URL.
Вот пример URL:
www.examplesite.com/dir/2012/06/19/title-of-some-story/FAQKZjC3veXSalP9zxFgZP/htmlpage.html
вот что моя Разбивка регулярного выражения выглядит следующим образом:
[site]/[dir]*?/[year]/[month]/[day]/[storyTitle]?/[id]/htmlpage.html
[id]
представляет собой строку из 22 символов в длине, которые могут быть либо прописными или строчными буквами , а также номера. Однако я не хочу извлекать это из URL. Просто уточняю
Теперь мне нужно извлечь два значения из этого URL-адреса.
Во-первых, Мне нужно извлечь каталоги. Тем не менее, [dir]
является необязательным, но также может быть как можно больше. Другими словами, этот параметр не может быть там, или он может быть dir1/dir2/dir3
..etc. Так, поднятие моего первого примера:
www.examplesite.com/dir1/dir2/dir3/2012/06/19/title-of-some-story/FAQKZjC3veXSalP9zxFgZP/htmlpage.html
Здесь мне нужно извлечь dir1/dir2/dir3
где реж является строкой, которая представляет собой одно слово со всеми строчными буквами (например, спорт/MLB/играми). В каталоге нет номеров, только используя это в качестве примера.
Но в данном примере действительный URL:
www.examplesite.com/2012/06/19/title-of-some-story/FAQKZjC3veXSalP9zxFgZP/htmlpage.html
Там нет [dir]
, так что я бы ничего не извлечь. таким образом, [dir]
является необязательным
Во-вторых, мне нужно извлечь [storyTitle]
[storyTitle]
, где также необязательно так же, как выше [dir]
, но тем не менее, если есть storyTitle
может быть только один.
Так поднятие моих предыдущих примеров
www.examplesite.com/dir/2012/06/19/title-of-some-story/FAQKZjC3veXSalP9zxFgZP/htmlpage.html
будет действительными, где мне нужно, чтобы извлечь 'title-of-some-story'
где название повести тира разделены строки, которые всегда в нижнем регистре. Пример belowis справедливо:
www.examplesite.com/dir/2012/06/19/FAQKZjC3veXSalP9zxFgZP/htmlpage.html
В приведенном выше примере, нет [storyTitle]
, таким образом, делая необязательным
Наконец, просто чтобы быть полным, URL-адрес без [dir]
и без [storyTitle]
также действительны. Пример:
www.examplesite.com/2012/06/19/FAQKZjC3veXSalP9zxFgZP/htmlpage.html
Допустимый URL. Любой вход был бы полезен, я надеюсь, что я понятен.
имена каталогов не имеют номера. Диск - это единственный мир, который является всеми буквами, а каждая буква - строчной. –
Я отредактировал вопрос. спасибо за вопрос –
Ой, извините, я удалил свой комментарий. Но в интересах не заставлять вас выглядеть сумасшедшим, добавлю, что мой вопрос в том, могут ли каталоги состоять из чисто цифр :) – cklab