Как извлечь только основной текст, используя cheerio? Я хочу перейти на неизвестные сайты и получить основной текст (или весь текст), просто используя nodeJS и Cheerio.Извлечь основной текст из HTML с помощью Cheerio
0
A
ответ
0
Решено с помощью NPM Moudle под названием boilerpipe
0
Использование библиотеки запроса и вы получите текст HTML обратно. Проверьте сайт, чтобы узнать, не использует ли он виртуальную DOM или теневую DOM, т.е. React. Если это так, методы Черио не работают, и вы получаете непригодный круглый объект.
Смежные вопросы
- 1. Извлечь основной текст из Outlook
- 2. Извлечь текст из URL с помощью HTML?
- 3. Невозможно извлечь фрагмент HTML с использованием Cheerio
- 4. scraping текст с cheerio
- 5. получить innerHTML из DOM с помощью Cheerio
- 6. Извлечь текст HTML с помощью Mysql
- 7. извлечение текста из html элементов с cheerio
- 8. Как извлечь текст с помощью ссылки html?
- 9. Cheerio HTML
- 10. Извлечь текст из текста HTML
- 11. Извлечь текст из таблицы HTML
- 12. извлечь текст из html ссылки с VBA
- 13. Анализ HTML-файла с использованием cheerio
- 14. извлечь текст из текстового поля HTML с помощью j2me
- 15. Помогает извлечь текст из таблицы HTML с помощью xpath
- 16. Как извлечь только текст из HTML-файла с помощью jsoup
- 17. Как извлечь текст из HTML с помощью XPath
- 18. Как извлечь текст из HTML-документа с помощью Web :: Query
- 19. Извлечь текст из списка элементов HTML с помощью jquery
- 20. Как извлечь текст из тега html с помощью регулярных выражений?
- 21. Как извлечь текст из HTML с помощью C++?
- 22. Извлечь текст и ссылки из HTML с помощью регулярных выражений
- 23. Невозможно извлечь текст из HTML с помощью SoupStrainer
- 24. Append HTML из файла с Cheerio, NodeJs
- 25. Cheerio: Извлечение текста из HTML с разделителями
- 26. Как извлечь атрибуты и текст из HTML?
- 27. Извлечь текст из строки с помощью Powershell
- 28. Извлечь текст из PCL6 с помощью Java
- 29. Извлечь текст из Javascript с помощью Python
- 30. Извлечь текст из pdf с помощью zlib