2009-12-29 3 views
0

Я немного застрял и нуждаюсь в помощи. Так оно и происходит. У меня есть сайт, на котором количество комментариев к определенной статье происходит из модуля комментариев. на нем отображается HTML-тег, который выглядит примерно так: (<em>1</em>). Недавно я обновил свой сайт с 5 по 6. Все остальное отлично работает. Пожалуйста, помогите.Как избавиться от HTML-тегов

Спасибо !!!

+0

Можете ли вы поместить больше света на ваш вопрос, кажется, его не ясно. –

+0

Ваша ссылка (1) кажется неработоспособной ... – rdmueller

+0

Уточняйте вопрос немного. Трудно предположить. Часть кода приветствуется. –

ответ

0

Предполагаете, вы хотите избавиться от <em>1</em>: \<em([^>]*)\>(\d[^>]*)\</(em[^>]*)\> -> удаляет весь текст в квадратных скобках, содержащий числа.

И если это неуклюжий, shh, я только вчера узнал регулярные выражения.

+1

Parsing html с регулярными выражениями ... это фольклор сейчас: не делайте этого! Наплыв Whatif приближается. Что делать, если скобки содержат открытый тег, а не закрывающий тег? Что, если есть несвязанная скобка, содержащая номер? * соответствует 0 или более, поэтому вы также можете сопоставить что-либо в скобках без цифры. Согласование также жадно, так что открытая скобка ближе к началу документа и близко ближе к концу будет сопоставлена, и весь документ будет идти. Etc и т. Д. Найдите «regex html» на SO, чтобы увидеть ужас. –

+0

Я видел крик бобинса о помощи. Я использую lxml для разбора моих деревьев. Тем не менее, я буду продолжать регулярное выражение в содержании моего сердца. Возможно, на свой страх и риск, но, по крайней мере, я кое-что узнаю о XD. – torger

1

Вы можете использовать strip_tags() функцию, чтобы удалить HTML из строки

Смежные вопросы