2010-08-21 3 views
19

Мне нужно использовать следующее регулярное выражение для проверки некоторых азиатских символовPHP - регулярное выражение - PCRE не поддерживает L, л, N, P,

$regexp = "/^[\-'\u2e80-\u9fff\sa-zA-Z.]+$/"; // with warning 

$regexp = "/^[\-'\sa-zA-Z.]+$/"; // without warning 

preg_match() [функция. preg-match]: Ошибка компиляции: PCRE не поддерживает \ L, \ l, \ N, \ P, \ p, \ U, \ u или \ X.

Вы знаете, как изменить шаблон регулярного выражения, так что я могу проверить азиатские символы из \u2e80-\u9fff

Я использую последний XAMPP

Apache/2.2.14 (Win32) DAV/2 mod_ssl/2.2.14 OpenSSL/0.9.8l mod_autoindex_color PHP/5.3.1 mod_apreq2-20090110/2.7.1 mod_perl/2.0.4 Perl/v5.10.1 

Спасибо

+0

См. [Regular-expressions.info/unicode](http://www.regular-expressions.info/unicode.html#category). Поддерживает '\ p {L}' и т. Д. И является полным ... Утверждение «PCRE не поддерживает \ L, \ l, \ N, \ P" ** находится рядом с ложным **. –

ответ

32

PCRE не поддерживают синтаксис \uXXXX. Вместо этого используйте \x{XXXX}. См. here.

Ваш \u2e80-\u9fff диапазон также эквивалентно

\p{InCJK_Radicals_Supplement}\p{InKangxi_Radicals}\p{InIdeographic_Description_Characters}\p{InCJK_Symbols_and_Punctuation}\p{InHiragana}\p{InKatakana}\p{InBopomofo}\p{InHangul_Compatibility_Jamo}\p{InKanbun}\p{InBopomofo_Extended}\p{InKatakana_Phonetic_Extensions}\p{InEnclosed_CJK_Letters_and_Months}\p{InCJK_Compatibility}\p{InCJK_Unified_Ideographs_Extension_A}\p{InYijing_Hexagram_Symbols}\p{InCJK_Unified_Ideographs}

Не забудьте добавить u модификатор (/regex here/u), если вы имеете дело с UTF-8. Если вы имеете дело с другой многобайтовой кодировкой, вы должны сначала указать convert на UTF-8.

Смежные вопросы