Я пытаюсь создать набор слов, что означает строго только алфавиты из .txt-файла. Этот txt-файл содержит все возможные символы, в том числе непечатаемый текст.Наборы слов из текстового файла
Нет библиотек re или collection. Python 3
Например, учитывая .txt файл, который читает
*eBooks$ Readable By Both Humans and By Computers, Since 1971**
*These# [email protected] Were Prepared By Thousands of Volunteers!
Я бы нужны мои наборы содержат
{'eBooks', 'Readable', 'By', 'Both', 'Humans', 'and', 'Computers', 'Since', 'These', 'Were', 'Prepared', 'Thousands', 'of', 'Volunteers'}
Вот то, что я сделал, но я все еще получаю специальные символы и цифры на моих наборах. Я только хочу алфавиты
import string
filecontent = []
word_set = {}
with open ("small.txt") as myFile:
for line in myFile:
line = line.rstrip()
line = line.replace("\t","")
for character in line:
if character in string.digits or character in string.punctuation:
line = line.replace(character, "")
if line != "":
filecontent.append(line)
lowerCase = [x.lower() for x in filecontent]
word_set = {word for line in lowerCase for word in line.split()}
Могу ли я спросить, почему вы исключаете ответы, используя MODULS с проверенные в использовании методы, сделанные точно для ваша? –
Делает вопрос? и как насчет слова вроде «есть»? –
@PadraicCunningham Cunningham Хорошо иметь и заказать не имеет значения с момента его набора –