Обычно я просто делаю это.Заменить "abc123def" на "abc 123 def" в многобайтовой строке
$str = preg_replace('#(\d+)#', ' $1 ', $str);
Если бы я знал, что это будет UTF-8, я хотел бы добавить нижний регистр «и» модификатор к шаблону, и я думаю, что было бы хорошо. Но из-за сообщений utf-8, принимающих 2x, а в некоторых случаях 3 раза меньше пространства памяти, чем это было бы, если бы использовался собственный набор символов, я пытаюсь не ограничивать приложение utf-8.
Таким образом, я стараюсь держаться подальше от своих любимых функций preg_.
Большинство вещей были довольно простыми до сих пор, но я немного застрял на заменах, где я обычно использовал классы символов в preg_, такие как «\ d».
Я думаю, что то, что я в конечном итоге собираюсь сделать здесь, продолжается со сценарием таким образом, что все базовые функции будут продолжать использовать функции mb_ таким образом, чтобы кодировка могла быть изменена, и отметьте несколько дополнительных функций, чтобы они были доступны только в том случае, когда активным кодированием является utf-8. – joebert