2013-03-25 3 views
19

Я побежал следующий сценарий, используя php.exe:PHP падает на preg_replace

preg_replace('#(?:^[^\pL]*)|(?:[^\pL]*$)#u','',$string); 

или его эквивалент:

preg_replace('#(?:^[^\pL]*|[^\pL]*$)#u','',$string); 

If $string="S" или $string=" ذذ " он работает, если string='ذ' она дает , что является некорректным, и if string='ذذ' Сбой в работе PHP.

Но он работает в версиях 4.4.0 - 4.4.9, 5.0.5 - 5.1.6.

Что не так?

См: http://3v4l.org/T3rpV


<?php 
$string='دد'; 
echo preg_replace('#(?:^[^\pL]*)|(?:[^\pL]*$)#u','',$string); 

Выход для 5.4.0 - 5.5.0alpha6

Process exited with code 139. 

Выход для 5.2.0 - 5.3.22, 5.5.0beta1

 

Выход для 4.4.0 - 4.4.9, 5.0.5 - 5.1.6

دد 

Выход для 4.3.11, 5.0.0 - 5.0.4

Warning: preg_replace(): Compilation failed: PCRE does not support \L, \l, \N, \P, \p, \U, \u, or \X at offset 7 in /in/T3rpV on line 3 

Выходной для 4.3.0 - 4.3.10

Warning: Compilation failed: PCRE does not support \L, \l, \N, \P, \p, \U, \u, or \X at offset 7 in /in/T3rpV on line 3 
функция
+2

Он врезается здесь тоже. PHP 5.4.7. –

+0

Я могу подтвердить, что он также сбой с последней бета-версией ** PHP 5.5.0beta2 ** (выпущен 28 марта)! – ComFreek

+0

@ComFreek Является ли мой ответ причиной сбоя? –

ответ

0

Наконец, ошибка была решена:

Output for 4.4.0 - 4.4.9, 5.0.5 - 5.1.6, 5.5.27 - 5.5.33, 5.6.11 - 7.0.4, hhvm-3.6.1 - 3.12.0 
    دد 
5

Вы можете использовать альтернативный mb_ereg_replace():

mb_internal_encoding("UTF-8"); 
mb_regex_encoding("UTF-8"); 
echo mb_ereg_replace('#(?:^[^\pL]*)|(?:[^\pL]*$)#u','',$string); 
+0

нет, его не вы можете [увидеть это] (http://www.php.net/manual/en/function.mb-ereg-replace.php) – 2013-03-25 06:15:38

+0

Ваше регулярное выражение действует совершенно по-другому и не эквивалентно моему. Попробуйте: '$ string = '. D.'' – PHPst

+0

мое регулярное выражение !!! Я не вижу этого! – 2013-03-25 07:54:46

3

может быть, это поможет:

эти свойства доступны только обычно работают на жидком, если PCRE скомпилирован с "--enable-юникод-свойства"

http://docs.php.net/manual/en/regexp.reference.unicode.php#96479

+1

Если эти свойства недоступны, PHP будет генерировать предупреждения вместо сбоев. –

+0

По собственному опыту у меня было тяжелое время, когда \ b (любой символ границы слова) молча работали с кириллическими символами, а просто игнорировали их, с другой стороны, работая по назначению с латинским. Мне пришлось использовать такие монстры, как '$ boundL = '(^ | [- \ s \.><,:; \! \?] +)';' '$ boundR = '($ | [- \ s \.><,:; \! \?] +) '; ' –

0

Используйте preg_quote, и перед тем, как использовать его с вашим регулярным выражением, вы должны должным образом избежать специального символа. Например:

<?php 
$string = preg_quote("\دد"); 
echo preg_replace('#(?:^[^\pL]*)|(?:[^\pL]*$)#u','',$string); 

в действии: http://3v4l.org/LeBXg

Подробнее о preg_quote.

Cheers,

Ardy

+0

' preg_quote' Введите символы регулярного выражения и не нужны для нормальных символов. Bur даже 'echo preg_replace ('# (?:^[^ \ PL] * | [^ \ pL] * $) # u', '', preg_quote ('ذذ'));' crashs. 'preg_quote (" \ دد ");' '' \\ ss', это другая строка. – PHPst

+0

Возможно, вы неправильно поняли цель 'preg_quote()', это означает, что нужно избегать специальных символов для использования * внутри * регулярных выражений :) –

+0

@PHPst: хороший улов, мой плохой. –

1

Глядя на самого выражения, есть две вещи, которые можно было бы улучшить:

  1. В * мультипликаторы не очень полезны; почему вы хотите заменить потенциально пустые совпадения пустой строкой? Фактически, запуск этого на моей системе дает NULL от операции preg_replace().

  2. Группы памяти могут быть объединены вместе.

Это код после применения как улучшения:

$string = 'ﺫﺫ'; 
var_dump(preg_replace('#(?:^[^\pL]+|[^\pL]+$)#u', '', $string)); 
// string(4) "ﺫﺫ" 

3v4l results

Если вы просто ищете функции многобайтовая дифферента (поддерживается 4.3.0 и далее):

$string=' دد'; 
var_dump(preg_replace('#(?:^\s+|\s+$)#u', '', $string)); 

3v4l results

+0

«На самом деле, запуск этого на моей системе дает NULL« Ого! На самом деле вы обнаружили ошибку пыльника: http://3v4l.org/H1Ihk – PHPst

+0

@PHPst Похож на это :) Помогает ли код в моем ответе? –

+0

@Jack Это не сбой, но выводит строку (6) «ذذ» вместо ожидаемого результата. – ComFreek