Я использую jsoup для синтаксического анализа всех ссылок URL из файла Строка, которая работает хорошо.Jsoup: parse url links отдельно
Часть строки содержимого с URLs, как вы видите ссылки представлены после текста «Инструкции по загрузке:», «Зеркало:» и «Дополнительно:»:
<u>Download Instructions:</u><br/>
<a class="postlink" href="https://test.com/info">https://test.com/info</a>
<br/>Mirror:<br/>
<a class="postlink" href="http://global.eu/navi.html">http://global.eu/navi.html</a>
<br/>Additional:<br/>
<a class="postlink" href="http://main.org/navi.html">http://main.org/navi.html</a>
Теперь моя цель для синтаксического анализа всех URL-адресов (может быть несколько) после текста «Инструкции по загрузке:« и текст «Зеркало:»отдельно, URL-адреса после «Дополнительные» должны игнорироваться.
Ниже всего лишь фрагментирует их все и добавляет их в (url) arraylist.
int j = 0;
Document doc = Jsoup.parse(content);
Elements links = doc.select("a.postlink");
for (Element el : links) {
String urlman = el.attr("abs:href");
if (urlman != null) {
url.add(j, urlman);
j++;
}
}
Было бы здорово, если бы кто-нибудь мог помочь.
Заранее спасибо.
Это великий Фредерик, многие ТНХ для ваших усилий. – Simon
@Simon Часть «может быть несколько» еще не выполнена, опубликует обновление через минуту или две. –
Thx заранее. – Simon