Разделить строку, используя регулярное выражение, как игнорировать апостроф?

Я делаю проверку орфографии учебник в Python и использует это регулярное выражение:Разделить строку, используя регулярное выражение, как игнорировать апостроф?

import re 
def split_line(line): 
    return re.findall('[A-Za-z]+(?:\`[A-Za-z)+)?',line)

мне было интересно, если вы могли бы помочь мне изменить эту функцию так, он будет игнорировать ', то есть, если я входная строка he's я будет получать ['he's'], а не ['he','s'].

источник

2015-02-27 JensD

Он даже скомпилирован? Этот '[A-Za-z]' должен быть '[A-Za-z]' (закрывающая скобка неверна). – Marcin

Можете ли вы показать нам пример строки и какой должен быть ожидаемый результат? – alfasin

Вы хотите апостроф ', но используйте обратный запрос 'почему ?. '[A-Za-z] + (?: \ '[A-Za-z] +)?' Должен сделать трюк. – georg

Прежде всего вам нужно исправить исходное выражение, заменив ) на ], как упоминалось в Marcin. Тогда просто добавить ' в список разрешенных символов (замаскировано задней косой чертой):

import re 
def split_line(line): 
    return re.findall('[A-Za-z\']+(?:\`[A-Za-z]+)?',line) 

split_line("He's my hero") 

#["He's", 'my', 'hero']

Конечно, это не будет рассматривать любые крайние случаи, когда апостроф в начале или в конце слова ,

источник

2015-02-27 07:46:02 Matt

Cheers Matt perfect. : P, из-за чего я задаю вопрос, как заставить его рассмотреть случаи краев. – JensD

Добро пожаловать. Рад, что смог помочь :) – Matt

Разделить строку, используя регулярное выражение, как игнорировать апостроф?

ответ

Смежные вопросы