2014-02-10 2 views
0

Я хочу исправить некоторые ситуации, связанные с urlparse.urljoin. Использование этой библиотеки, какдиректория python urljoin не включает

urljoin('http://xxxx.yyy/directory/','file.file') 

дает мне http://xxxx.yyy/directory/file.file, но если я не даю слэш наконец, в URL, как

urljoin('http://xxxx.yyy/directory','file.file') 

дает мне http://xxxx.yyy/file.file и это distrube мне писать автоматический сбор программы. У любого есть решения для решения этой проблемы. Я пытался поставить слеш в прошлом с регулярным выражением и замены, но они не работают должным образом, когда гиперссылка закончена как

http://xxxx.yyy/zzzz/file.file 

ответ

0

Это правильно себя. Если вы находитесь на http://example.com/index.html и щелкните ссылку на two.html, вы получите http://example.com/two.html. Вот как работают относительные URL-адреса.

urljoin не имеет способа узнать, является ли последний компонент каталогом или нет. Вы можете попытаться угадать, возможно, глядя на ., и добавьте косую черту, если вы думаете, что она должна быть там.

+0

Я знаю, что urljoin работает правильно. поэтому я также попытался проверить с расширением, но некоторые файлы связаны без расширения. Благодаря ответу Eevee :) – user2547494

Смежные вопросы