2009-12-23 4 views
0

Привет Я хочу сохранить исходный код веб-сайта в файл с помощью java. Из исходного кода я хочу получить только содержимое содержимого <script> </script>, как я могу это сделать?Получить содержимое тега Javascript

+0

сделать вы имеете в виду Java или JavaScript? Они совершенно разные технологии ... – Val

+1

Он хочет получить Javascript вне страницы, используя Java. –

+2

У вас есть Javascript в теме, но Java в вашем вопросе. Что он? Java - это Javascript, как ветчина для хомяка. –

ответ

3

Используйте HTML-парсер в Java для извлечения текста из HTML.

+0

Чтобы развернуть (справа) ответ немного: вот несколько перечисленных: http://java-source.net/open-source/html-parsers – BalusC

1

После того как вы загрузили исходный код в переменную в Java, найдите позицию <script> и позицию </script> в файле и удалите все, что находится внутри этого диапазона.

Что-то вроде:

String sourceCode = "source code here" 
String startTag = "<script>"; 
String endTag  = "</script>"; 

    int startInt = sourceCode.indexOf(startTag); 
    int endInt = sourceCode.indexOf(endTag); 

Так подстрока будет:

String jsCode = sourceCode.substring(startInt,endInt); 

(Это может быть явно не так, я не могу проверить это на данный момент, извините)

+0

Я не уверен, как это сделать, можете ли вы направить меня на любой учебник или пример, который я исследовал с помощью Google несколько дней уже по-прежнему не могу найти то, что именно я хочу – user236501

+0

Это будет работать, только если на странице есть один элемент сценария ... – Val

+0

Привет, но мой исходный код получил несколько элементов сценария, любое решение для захвата нескольких элементов