У меня был код, который отлично работал, удаляя пунктуацию/цифры с использованием регулярных выражений в python, мне пришлось немного изменить код, чтобы рабочий стол остановился, что не особенно важно. В любом случае, теперь пунктуация не удаляется и, откровенно говоря, я в тупике, почему.Удаление пунктуации/цифры из текстовой проблемы
import re
import nltk
# Quran subset
filename = raw_input('Enter name of file to convert to ARFF with extension, eg. name.txt: ')
# create list of lower case words
word_list = re.split('\s+', file(filename).read().lower())
print 'Words in text:', len(word_list)
# punctuation and numbers to be removed
punctuation = re.compile(r'[-.?!,":;()|0-9]')
for word in word_list:
word = punctuation.sub("", word)
print word_list
Любые указатели о том, почему он не работает было бы здорово, я не эксперт в Python, так что это, вероятно, что-то до смешного глупо. Благодарю.