В настоящее время я работаю над проектом с использованием Python, и я столкнулся с небольшой проблемой.Обнаружить, если тот же url
Скажем, у меня есть два URLs:
- url1 =
'www.google.com'
- URL2 =
'google.com/'
Теперь, очевидно, эти два адреса эквивалентны: оба они прямо на той же странице. Однако моя простая реализация сравнения строк не может обнаружить это. Есть ли какой-либо существующий метод для обнаружения, если 2 URL-адреса относятся к одной и той же веб-странице?
(первый раз после, и я не нашел ничего похожего на это,. Мои извинения, если что-то подобное уже было предложено)
Как насчет выполнения HTTP GET и сравнения заголовков в результате? Как насчет вещей после «/»? – BenDundee
С другой стороны, я не уверен, что это сработает ... – BenDundee
Я мог бы сделать что-то подобное, я бы подумал; но я бы подумал, что это даст гораздо большее время выполнения. Я уже запускаю это на тысячах URL-адресов (все они представлены в файле .txt) –