У нас есть текущий метод, который очищает из символов, которые не являются алфавитный или пробелы, который является простоПоддержка java regex для значений non-ascii?
String clean(String input)
{
return input==null?"":input.replaceAll("[^a-zA-Z ]","");
}
, которые действительно должны быть закреплены, чтобы поддержать не английские символы (например, S, U, ...). К сожалению, классы регулярных выражений java (например, «\ W» - символ без слова, «\ p {Alpha}» -US-ASCII).), Похоже, не поддерживают это. Есть ли способ сделать это с помощью java regex, а не зацикливать вручную, хотя каждый персонаж должен его протестировать?