Мне интересно, знает ли кто-нибудь о хорошей библиотеке Java для измерения эквивалентности HTML?Измерение эквивалентности HTML?
Например, <td class="one two three" name="goat">
будет эквивалентно <td name="goat" class="three two one">
. Я хотел бы сравнить все многострочные строки html таким образом, используя Java.
Любые предложения?
UPDATE:
поэтому я попытался использовать Diff.similar XMLUnit (в) и обнаружил, что я получаю, что эти два были похожи:
<html three="3" two="2" one="1"></html>
и <html one="one" two="two"></html>
Это нежелательное поведение. .. Есть ли другие варианты?
Похоже, вы хотите разобрать его как XML, а затем сравнить дерево doc? – Seth