2016-01-24 2 views
0

Есть ли текстовый редактор, программное обеспечение, сценарий, код, снайпер или что-то подобное для генерации вывода, аналогичного тому, что изображено на картинке из html-файла? В других работах что-то выводит только теги разметки html. Спасибо, что помогли мне. output sample Before and AfterКак извлечь метки html метки разметки

Вот до и после изображения того, что мне нужно, чтобы вы, ребята, можете понять, что я ищу. Я не так хорошо разбираюсь в вещах. Спасибо

+0

Я не знаю одного, но то, что вы можете сделать, это разобрать текст и заменить что-либо найденное между кавычками ('' something-') пробелом (' '' '). – GAntoine

+0

Спасибо, но на самом деле мне не нужно ничего менять между кавычками, мне нужно избавиться от всего, что есть между тегами <>. –

+0

Значит, выходной образец, который вы связали, неверен? – GAntoine

ответ

0

Я не знаю инструмента для этой задачи. Я думаю, что это интересная идея изучить структуру html-файла, подобного этому. Мне нужно было несколько раз, так что я написал маленькую утилиту командной строки, которая должна сделать работу:

html_skeleton (https://github.com/antonharald/html_skeleton)


Что он делает:

  1. Чтение файла
  2. Анализ структуры HTML до виртуального домена
  3. Рекурсивно посетите все элементы HTML. Для каждого из них: Удалите значения атрибута и в случае отсутствия детей: Удалите его текстовое содержимое.
  4. Преобразование управляемого DOM в HTML-код и его печать.

У меня не было времени проверить это так, так было бы приятно услышать, если бы это сработало для вас.

+0

Спасибо Антон. Да, это сработало для меня. Это отличный инструмент и может быть еще больше, если он может быть прикреплен как букмарклет к браузеру для обработки удаленных файлов вместо файлов в локальном хосте. Спасибо, что поделились этим инструментом. –

Смежные вопросы