Я ищу функциональный эквивалент C/C++ для HTML :: Defang, и мой Google-fu не смог ничего раскрыть. Я хочу сохранить любые доброкачественные теги и вырезать/деформировать все остальное. Отсутствие реальной библиотеки, любые указатели для завершения списков тегов/атрибутов/etc в defang были бы оценены. Я знаю http://en.wikipedia.org/wiki/DOM_Events. Благодарю.Лучшая библиотека C/C++ для фильтрации HTML?
ответ
В Java я использую JTidy для очистки HTML. Я не уверен, что это подойдет вашим потребностям, но если вы используете Google для JTidy, вы также можете перейти по ссылке на реализацию C/C++ и посмотреть, делает ли она то, что вы хотите.
Что касается дефанга: посмотрите на спецификации W3C для HTML; любой тег, который не находится там, не принадлежит HTML. Но опять же, я мог бы не понимать вашу концепцию «defang».
В принципе, я хочу, что веб-системы электронной почты делают, когда они представлены с электронной почтой HTML. Покажите, что они могут, уничтожите остальных, включая любые атаки. – 2009-12-17 19:16:01
Это больше искусство, чем наука. Я думаю, вам будет хорошо, если Tidy вычеркнет любые сценарии. Но я не могу оценить Tidy для вас. Попробуй! –
libxml2 является бесплатным и должен делать то, что вы хотите.
Смотрите эту часть API: http://www.xmlsoft.org/html/libxml-HTMLparser.html
htmlReadFile()
функция может сделать трюк.
Чтобы вы начали с libxml2 некоторые примеры можно найти здесь:
- 1. Лучшая библиотека HTTP для Java?
- 2. Библиотека Python для фильтрации XSS?
- 3. Лучшая библиотека .NET для деревьев
- 4. Лучшая библиотека OpenID для Java
- 5. Лучшая библиотека протоколирования для C++
- 6. Лучшая библиотека pdf для рельсов
- 7. Лучшая библиотека для iOS sdk
- 8. Лучшая библиотека для метаданных аудиофайлов?
- 9. Лучшая библиотека UI для PHP
- 10. Лучшая библиотека для рендеринга столов?
- 11. Лучшая библиотека для сеансов PHP
- 12. Лучшая библиотека CRUD для codeignitier?
- 13. Лучшая библиотека iCalendar для Java?
- 14. Лучшая библиотека архиватора для iOS
- 15. Лучшая библиотека Coldfusion для OpenID
- 16. Лучшая библиотека javascript для преобразования HTML/DOM в Canvas
- 17. Лучшая логика для фильтрации на основе NSDate
- 18. Лучшая практика фильтрации ICollection для просмотра?
- 19. Лучшая межплатформенная библиотека?
- 20. Лучшая библиотека виджета GWT?
- 21. Лучшая библиотека агента пользователя для Codeigniter
- 22. Библиотека констант - лучшая практика?
- 23. Лучшая библиотека java twitter?
- 24. Лучшая графическая библиотека Java
- 25. Лучшая библиотека Lua OOP
- 26. Библиотека Java для фильтрации введенного пользователем контента?
- 27. Байесовская библиотека фильтрации спама для Python
- 28. Самая лучшая техническая библиотека валидации
- 29. Лучшая практика фильтрации непечатаемых символов
- 30. Лучшая библиотека для векторного массива в C++
В этом контексте, что HTML :: Дэфан? –