2015-03-05 3 views
0

Как удалить все специальные символы, такие как & mdash; & nbsp; и другие из строки non-html? У меня есть объект Java String с этим мусором. Мне нужно удалить все специальные строки, такие как & mdash; & nbsp; & laquo; & raquo; и т. д. Как это сделать с помощью java? У меня нет строки html.Как удалить все специальные символы, такие как —   и другие из строки, отличной от html?

+1

Итак, вы хотите удалить любую подстроку, состоящую из амперсанда, за которой следует несколько букв, за которым следует точка с запятой; это правильно? –

+0

Возможный дубликат: https://stackoverflow.com/questions/994331 – beresfordt

+0

beresfordt, я думаю, что это хорошее решение – Curiosity

ответ

0

использовать replaceAll метод строки.

String str = ... 
str =str.replaceAll(" "," "); //changes &nbsp to space 

Если вы просто хотите удалить все из них (замените на ""). Чтобы справиться со всеми нежелательными последовательностями за один раз, определите запросчик и используйте его для удаления последовательностей.

Pattern p = Pattern.compile(...) 
Matcher m = p.matcher(str); 
str = m.replaceAll(""); 
Смежные вопросы