У меня есть данные, разделенные на файлы. Я пытаюсь просмотреть данные на файл и искать смайлики :(
и :)
, как определено регулярным выражением. Если найден смайлик, мне нужно сохранить информацию: а) смайлик был найден b) в этом файле. Когда я запускаю этот кусок сценария и печатаю словарь смайликов, я получаю 0 в качестве значения. Как это возможно? Я начинающий.регулярные выражения смайлики
emoticon = 0
for fileid in corpus.fileids():
m = re.search('^(:\(|:\))+$', fileid)
if m is not None:
emoticon +=1
Я использую функцию fileid в NLTK. Каждый файл содержит 1 предложение. Поэтому я хочу проверить смайлики в каждом идентификаторе файла или в предложении. Разве это невозможно? O, и я не хочу проверять строки, содержащие только смайлики, мне придется изменить мое регулярное выражение. Благодаря! :) – JohnDoe
Я исправил ошибку, которую я сделал с файлом. – JohnDoe