2015-10-14 2 views
1

Я создал эту функцию на python, чтобы извлечь некоторые вопросы из файла .txt. Но эта функция дает мне только слова без акцента и игнорирует акцент. Plz помогите мне изменить эту функцию или регулярное выражение, чтобы поймать слова с акцентом тоже.Поиск в файле акцентных слов в python

def extraiNormalize(nameFile): 
    file = open(nameFile, 'rU') 
    questions = [] 
    for line in file: 
     field = re.search(r".*User Input:\s*([A-Za-zÀ-ú\s]+[\?])$", line) 
     if field is not None: 
      quest = field.group(1) 
      questions.append(quest) 
    file.close() 
    print_list(questions) 
+0

Как добавить флаг Unicode? 'padrao = re.compile (regular_expression, re.M | re.I | re.U)' – Kasramvd

+0

Я немного изменил свой код, потому что версия раньше не была правильной. Так что re.compile() не требуется в этой версии, я думаю. –

+0

Это не имеет большого значения, вы все равно можете добавить флаг 're.U' в функцию' re.search'. – Kasramvd

ответ

0

Я нашел решение для своего дела, где я только что отредактировал эту строку и добавил некоторые теги.

поле = re.search (и "Ввод данных пользователем:. \ S ([A-Za-Za-ú \ s] + [? \]) $", Line.decode ('utf8'), re.UNICODE)

Смежные вопросы