Здесь, в этом коде, я хотел разобрать весь html-файл (локальный) в переменной документа, но я заметил, что он обрабатывает только 10% содержимого. Пожалуйста помоги!!Невозможно разобрать полную html-страницу в документе
Document doc=null;
HashSet<String>urlSet=null;
try {
doc = Jsoup.parse(file,null);
} catch (IOException e) {
e.printStackTrace();
return urlSet;
}
urlSet=getLinks(doc);
if(urlSet!=null)
urlSet=refineURLs(urlSet);
return urlSet;
Насколько велик '' '' '' '' 'Строка в байте? – luksch
html размер файла, если 100kb. Он загружается по этой ссылке https://en.wikipedia.org/wiki/Developmental_biology и сохраняется как html-файл. – uniquephase