есть хороший справочник о том, как разобрать HTML комментариев робастно особенно где HTML содержит JavaScript, который может сломаться комментариемразбор HTML комментария правильно
, например:
<!--
<script type="text/javascript">
for(var i = 10; i > 0; i--) {
if(myar[i].status > 3) {
ntlp++;
}
}
</script>
-->
два минуса-х и более 3 в сценарии можно считать конкатенацией, которая интерпретируется как '->' (если вы правильно следуете спецификации html/sgml ).
В любом случае, есть ли список правил/gotchas для обработки всего этого? В C предпочтительнее, иначе псевдокод тоже замечательный.
благодаря
Ashod
Да, * использовать парсер HTML * :) См. Спецификацию HTML для правил синтаксического анализа. –