Мне нужно обработать некоторый HTML-код, который имеет плохую структуру - например.XSLT: помогите мне исправить несколько тегов BODY
<html>
<body>...</body>
<body>...</body>
</html>
Какой самый лучший способ превратить этот HTML, так что содержимое второго тела появляются внутри первого, за исключением, конечно, дополнительный тег тела? Я не хочу ничего манипулировать этим правилом.
Я думал о совпадении в теге html и обрабатывал его там, используя явные вызовы с применением шаблонов, но для меня это кажется немного небрежным. Я знаю, как совместить ложные тела («body [position()> 1]»), но мне хотелось бы получить некоторые идеи о том, как лучше всего написать преобразование.
Редактировать: Мне нужно применить другие шаблоны для детей всех этих элементов, поэтому простая копия не будет работать.
И я хотел бы сохранить комментарии и инструкции по обработке. Я хочу почти весь документ как преобразование идентичности, за исключением этих нескольких тел и некоторых других незначительных изменений, которые я уже делаю успешно.
Редактировать 2: Важно сохранить дочерние элементы второго элемента тела в приведенном выше примере. Они должны быть дочерними элементами первого тега тела на выходе, в конце дочерних узлов первого тега тела.
Редактировать 3: Вот некоторый иллюстративный ввод/вывод (не проверяется на достоверность):
<html>
<!-- Look at my comments -->
<head>
<title>My title!</title>
<!-- Commentary -->
</head>
<body>
<p>Something <b>bold</b></p>
</body>
<body>
<!-- heh -->
<p>Some bozo put my parent in here.</p>
</body>
<body>
<p>More stuff here</p>
</body>
</html>
должны быть:
<html>
<!-- Look at my comments -->
<head>
<title>My title!</title>
<!-- Commentary -->
</head>
<body>
<p>Something <b>bold</b></p>
<!-- heh -->
<p>Some bozo put my parent in here.</p>
<p>More stuff here</p>
</body>
</html>
Пояс и подтяжки хороши, потому что есть как минимум три тега тела :) –
Миссис Россни не поднимала никаких глупых детей. На самом деле это неправда, но это не я. –