Strip html tags, css и js код из строки

Я использую document.documentElement.textContent.toLowerCase(), чтобы прочитать текстовое содержимое веб-сайта, проблема заключается в том, что на этом веб-сайте так много кода css и js перед любым реальным текстом, что я даже не получаю полный текст , он транслируется в некоторой части css.Strip html tags, css и js код из строки

Как удалить весь код css и js для получения только текстового содержимого?

источник

2010-11-03 gtilx

Возможно, образец источника поможет – Prozaker

Как насчет этого?

var text = document.getElementsByTagName('body')[0].textContent.toLowerCase();

источник

2010-11-03 01:26:44 alex

Да, это работает на этом сайте, но на всех сайтах есть тег тела? – gtilx

@gtilx Если они действительны HTML, то да. – alex

Большинство современных браузеров, вероятно, тем не менее сделают это автоматически доступным. <- непроверенная заявка – Quickredfox

Strip html tags, css и js код из строки

ответ

Смежные вопросы