2011-12-22 3 views
2

Я разбираю RSS-канал с PHP - и я описание/название содержит несколько специальных символов, например, ниже.Специальные символы при разборе в PHP

мастер французский повар â € «в

Как я могу убрать это? - Я смотрел на strip_tags и т. д., но это не служит цели. Посмотрел на php.net, но не нашел хороший/эквивалент stripallspecialcharacters ($ string) - есть ли что-то вроде доступного в PHP? Благодарю.

+3

Просто для того, чтобы быть в безопасности: Вы уверены, что в фиде есть эти символы, или вы просто видите их на выходе HTML? Я спрашиваю, потому что это выглядит как простая проблема с кодировкой. –

+0

@ Мадмартиган, как мы, кажется, комментируем одни и те же вопросы ??? –

ответ

2

Посмотрите, как Regex будет лучшим выбором для этого

preg_replace('/[^[:alpha:][:punct:][:digit:]]/u', utf8_encode($input), ''); 


Найдено это от этого вопроса ранее просил
stackoverflow.com/questions/4651899/regex-to-reject-non-english-characters

Но есть проблема с использованием регулярных выражений может работать для большинства ваших но затем не для каждого, поэтому вы можете захотеть ходить по магазинам вокруг одного, который подходит именно вам.

Смежные вопросы