Я знаю, что \w
соответствует любому символу слова [a-zA-Z0-9_]
или [\p{L}\p{N}_]
если скомпилирован с (?u)
.Как совместить языковые символы в регулярном выражении?
Французский язык содержит 42 символов [a-zàâæçéêëîïôœùûüÿ]
. Возможно ли построить мое регулярное выражение по моему locale
.
Как я могу сопоставить [a-zàâæçéêëîïôœùûüÿ]
с \w
?
Частичным ответом было бы использовать регулярные выражения unicode с \p{Latin}
.
Пожалуйста, отметьте свой вопрос на языке программирования, который вы используете. Вы получите лучший ответ таким образом. –
Возможный дубликат [Регулярное выражение для соответствия неанглийским символам?] (Http://stackoverflow.com/questions/150033/regular-expression-to-match-non-english-characters) –
Это зависит от вашего механизма регулярных выражений , но '\ w' обычно, или может быть сделано, зависит от языка. – chepner