2014-01-31 6 views
2

Как разделить по группам ASCII символов в Regex (Android/Java)Как спичку и Split REGEX

Actual Струнный
"Я я по-английски на Бенгальский"

Ожидаемый результат
Я
я
бенгали на английский

+0

может захватить группы помочь? я не знаю –

+0

любые шаблоны для расщепленных ASCII символов –

+0

пытались «^ \\ р {ASCII} * $», но это не помогает –

ответ

2

Вы всегда могли разделить на следующие:

(?<=[\u0021-\u007E])\s+(?=[^\u0021-\u007E])|(?<=[^\u0021-\u007E])\s+(?=[\u0021-\u007E]) 

Это расщепляется на пробельных предшествуют стандартного латинского алфавита и последующим не стандартного латинского алфавита илине стандартный латинский символ с последующим стандартный латинский символ. Конечно, вы можете модифицировать юникод диапазоны, чтобы принять посмотрев here в качестве ссылки.

+0

я собирался отправить 'раскол (» (? <= \\ P {ASCII }) \\ s (= \\ р {} ASCII) |? (<= \\ р {ASCII}) \\ s (= \\ р {} ASCII) «)' но изделия первым?. +1. – Pshemo