Привет Я хочу сохранить исходный код веб-сайта в файл с помощью java. Из исходного кода я хочу получить только содержимое содержимого <script> </script>
, как я могу это сделать?Получить содержимое тега Javascript
ответ
Используйте HTML-парсер в Java для извлечения текста из HTML.
Чтобы развернуть (справа) ответ немного: вот несколько перечисленных: http://java-source.net/open-source/html-parsers – BalusC
После того как вы загрузили исходный код в переменную в Java, найдите позицию <script>
и позицию </script>
в файле и удалите все, что находится внутри этого диапазона.
Что-то вроде:
String sourceCode = "source code here"
String startTag = "<script>";
String endTag = "</script>";
int startInt = sourceCode.indexOf(startTag);
int endInt = sourceCode.indexOf(endTag);
Так подстрока будет:
String jsCode = sourceCode.substring(startInt,endInt);
(Это может быть явно не так, я не могу проверить это на данный момент, извините)
Я не уверен, как это сделать, можете ли вы направить меня на любой учебник или пример, который я исследовал с помощью Google несколько дней уже по-прежнему не могу найти то, что именно я хочу – user236501
Это будет работать, только если на странице есть один элемент сценария ... – Val
Привет, но мой исходный код получил несколько элементов сценария, любое решение для захвата нескольких элементов
сделать вы имеете в виду Java или JavaScript? Они совершенно разные технологии ... – Val
Он хочет получить Javascript вне страницы, используя Java. –
У вас есть Javascript в теме, но Java в вашем вопросе. Что он? Java - это Javascript, как ветчина для хомяка. –