Я пытаюсь разобрать страницу, чтобы найти все действительные URL-адреса, но вот проблема. На странице есть 3 типа ссылок: url (_http: //site.com/dir/page.html), абсолютный uri (/dir/page.html) и относительный uri (dir/page.html без начальной косой черты) , Вероятно, я ошибаюсь в терминологии, я не html-кодер. Но это не так.
Мне нужно найти и собрать все URL-адреса (т. Е. _http: //site.com/dir/subdir/page.html и т. Д.). И вот проблема. Если есть страница _http: //site.com/dir/page.html со ссылкой вроде < a href = "subdir/page.html" > ссылка </a > это должно привести нас на сайт _http: // .com/реж/подкаталог/page.html. Но если в главном разделе страницы есть < base href = "/" >, то такая же ссылка ведет к _http: //site.com/subdir/page.html, то есть отличается от _http: //site.com/dir/ подкаталог/page.html.
Вопрос в том, может ли быть что-либо еще в html-коде на странице, которая может влиять на целевой URL-адрес.
Спасибо заранее.Анализ относительных ссылок на странице html
ответ
В HTML как таковой нет ничего другого рядом с HREF базы Вы упомянули
Что может стать сложным и следует принимать во внимание, что там может быть связь на странице, сделанные выполнения скрипта, поэтому такие вещи, как window.location. href = что-то. Это было бы легко, если бы ссылки были четко изложены, но они также могут быть вычислены по сценарию, а затем вы можете пропустить ссылку или прочитать ее неправильно, используя простой синтаксический анализ.
Ваша проблема в том, как работает ссылка на url в html, пожалуйста, прочитайте: http://www.webdevelopersnotes.com/design/relative_and_absolute_urls.php3. Скажите, что вы находитесь в/admin /, и вам нужен /admin/login.aspx. Мой относительный URL - login.aspx, в то время как мой абсолютный /admin/login.aspx имеет смысл?
Так что, в основном, я говорю, это какой каталог, на который ссылается ваша ссылка. Это определит тип и содержание URL-ссылки для использования.
Кроме этого, как уже указывалось, код jscript и серверный код также могут связывать.
- 1. Использование относительных адресов HTML на главной странице
- 2. Установка относительных ссылок
- 3. Создание ссылок на HTML-странице
- 4. PHP - преобразование относительных ссылок на абсолютные URL
- 5. Исправление относительных ссылок в PHP
- 6. Tidy URL потери относительных ссылок
- 7. Анализ HTML-ссылок для поиска конкретных ссылок (без ключевых слов)
- 8. Анализ HTML-ссылок с использованием C#
- 9. Устранение символических ссылок и относительных URL-адресов
- 10. Python Regex для извлечения относительных ссылок href
- 11. Анализ HTML-страницы для извлечения ссылок
- 12. как переименовать URL с Htaccess, не влияя на относительных ссылок на странице
- 13. URL-адрес Маршрутизация и поведение относительных ссылок
- 14. Excel Application.WorksheetFunction.CountIf с использованием относительных ссылок
- 15. Регулярное выражение для относительных ссылок ТОЛЬКО
- 16. Прокрутка страницы на одной странице с использованием относительных или абсолютных URL-адресов с # привязкой ссылок?
- 17. HTML относительных ссылки на различных доменах
- 18. Используя ссылку на одну ячейку для создания относительных ссылок
- 19. Force Visual Studio для вставки путей относительных ссылок на файлы
- 20. Изменение всех ссылок на странице
- 21. Анализ файла Resx с ошибками C# на относительных путях
- 22. Хотите запустить только ссылки id ссылок на другой странице html?
- 23. Анализ URL-адреса в читаемом формате json на странице HTML?
- 24. Анализ HTML на Java?
- 25. Расширение Google Chrome: Получение всех ссылок на странице
- 26. количество ссылок на веб-странице с WebView
- 27. NavigateToStream. Какой URI (если есть) используется для разрешения относительных ссылок?
- 28. Замена корневых относительных ссылок с полными URL-адресами
- 29. Изменение ссылок на шаблоны на странице wordpress
- 30. Несколько ссылок на библиотеку JQuery на странице
Спасибо! На самом деле я не рассматриваю код, созданный на стороне клиента, только тело ответа pure text/html :) – user1926948