2010-11-03 2 views
0

Я использую document.documentElement.textContent.toLowerCase(), чтобы прочитать текстовое содержимое веб-сайта, проблема заключается в том, что на этом веб-сайте так много кода css и js перед любым реальным текстом, что я даже не получаю полный текст , он транслируется в некоторой части css.Strip html tags, css и js код из строки

Как удалить весь код css и js для получения только текстового содержимого?

+0

Возможно, образец источника поможет – Prozaker

ответ

0

Как насчет этого?

var text = document.getElementsByTagName('body')[0].textContent.toLowerCase(); 
+0

Да, это работает на этом сайте, но на всех сайтах есть тег тела? – gtilx

+0

@gtilx Если они действительны HTML, то да. – alex

+0

Большинство современных браузеров, вероятно, тем не менее сделают это автоматически доступным. <- непроверенная заявка – Quickredfox

Смежные вопросы