Как разделить по группам ASCII символов в Regex (Android/Java)Как спичку и Split REGEX
Actual Струнный
"Я я по-английски на Бенгальский"
Ожидаемый результат
Я
я
бенгали на английский
Как разделить по группам ASCII символов в Regex (Android/Java)Как спичку и Split REGEX
Actual Струнный
"Я я по-английски на Бенгальский"
Ожидаемый результат
Я
я
бенгали на английский
Вы всегда могли разделить на следующие:
(?<=[\u0021-\u007E])\s+(?=[^\u0021-\u007E])|(?<=[^\u0021-\u007E])\s+(?=[\u0021-\u007E])
Это расщепляется на пробельных предшествуют стандартного латинского алфавита и последующим не стандартного латинского алфавита илине стандартный латинский символ с последующим стандартный латинский символ. Конечно, вы можете модифицировать юникод диапазоны, чтобы принять посмотрев here в качестве ссылки.
я собирался отправить 'раскол (» (? <= \\ P {ASCII }) \\ s (= \\ р {} ASCII) |? (<= \\ р {ASCII}) \\ s (= \\ р {} ASCII) «)' но изделия первым?. +1. – Pshemo
может захватить группы помочь? я не знаю –
любые шаблоны для расщепленных ASCII символов –
пытались «^ \\ р {ASCII} * $», но это не помогает –