2010-10-22 2 views
0

Мне хорошо известно, что разбор HTML с регулярным выражением имеет множество предостережений и громких противников. Поэтому вместо того, чтобы пытаться изобрести колесо, я ищу инструмент, который я могу указать на веб-страницу, и сказать «Получите комментарии, b * tch».HTML Комментарии Extracter

Любой, кто может посоветовать?

Я читал некоторые документы OWASP или блог безопасности, и я почти уверен, что видел инструмент, выполняющий эту задачу. К сожалению, Google не пользовался нулевой поддержкой.

Приветствия

+1

Какой язык/платформа? –

+0

Какой язык? Кроме того, какой контент вы хотите извлечь? Весь текст? Какой-то текст? Изображений? У вас есть страница с примерами? – Simon

+0

@Pekka, вы не можете сделать это в HTML? ohmygosh. – Marko

ответ

0

Mhhhhh ... Я думаю, что поиск в Google с используемой ОС и некоторым умным ключевым словом дает вам все, что вы хотите. Для системы на базе UNIX выглядит: parse HTML with SED and PERL

Для ОС Windows Я думаю, что вы можете искать что-то с VBS (VBScript).

Смежные вопросы