im new для crawler4j. Я просканировал сайт до определенной глубины и нашел то, что искал. То, что я пытаюсь сделать сейчас, - это отследить мои шаги и узнать, как я попал на эту страницу. Мне нужен список ссылок, которые привели меня на страницу, на которой я искал контент.crawler4j получить полный список родителей
Моя попытка была изменить метод визита в гусеничном
@Override
public void visit(Page page) {
String url = page.getWebURL().getURL();
// condition for content found
boolean contentFound = false;
// compute 'content found' here
if (contentFound) {
System.out.println(page.getWebURL().getParentUrl());
getMyController().shutdown();
}
}
Это только дает мне строку родительского URL.
page.getWebURL().getParentDocid();
только получает мне идентификатор документа родителя, но как я могу узнать родителя этой страницы?
Спасибо!
Спасибо! Прекрасно работает – IDontKnow