Мне нужно создать список слов из текстового файла. Список будет использоваться в коде палача и необходимо исключить следующие из списка:Список слов из текстового файла
- дублирующихся слов
- слова, содержащие менее 5 букв
- слова, которые содержат «хх» в качестве подстроки
- слова, содержащие буквы верхнего регистра список
этого слова, то должно выводиться в файл, так что на отдельной строке каждое слово. Программа также должна выводить количество слов в конечном списке.
Это то, что у меня есть, но оно работает неправильно.
def MakeWordList():
infile=open(('possible.rtf'),'r')
whole = infile.readlines()
infile.close()
L=[]
for line in whole:
word= line.split(' ')
if word not in L:
L.append(word)
if len(word) in range(5,100):
L.append(word)
if not word.endswith('xx'):
L.append(word)
if word == word.lower():
L.append(word)
print L
MakeWordList()
Как это работает неправильно? Что вы ожидаете, и что на самом деле происходит? –
Это не забирает слова, которые составляют менее 5 букв, и удерживает слова заглавными буквами. – user2259766