Я хочу проанализировать текст и сохранить только слова с альфа-символами или с символом '
(39 в ASCII). Для Exemple:Регулярное выражение разделить слово, используя число как токен
I know that Dave's car is 'broken'.
должен быть проанализирован в
I/know/that/Dave's/car/is/broken
(где /
просто чтобы показать, что это еще одно слово).
До сих пор у меня есть:
regex e ("\\b[A-Za-z']+\\b");
, но это не расщепляется abc2efg
в abc/efg
который был бы конечный результат я хочу получить.
Спасибо за ваши ответы.
что делает '\ b' значит? – Nim
Он соответствует границе слова. Я не знаю, является ли эта реализация лучшей, но на данный момент она может анализировать пример, который я дал правильно, но не два слова, разделенные числом. – Daxid
Попробуйте 'regex e (" \\ b [A-Za-z] + (?: '[A-Za-z] +)? \\ b ");' или 'regex e (" (?:^| [^ A-Za-z]) ([A-Za-z] + (?: '[A-Za-z] +)?) (?! [A-Za-z]) ");' и grab Group1 contents –