Спасибо за помощь до сих пор ребята! Огромная помощьPython Удалить строки, содержащие небуквенные маркеры
Так что это мой сценарий до сих пор,
import re
bad_words = '[^a-zA-Z\d\s:]'
with open('keywords.txt', encoding="utf8") as oldfile, open('newfile.txt', 'w') as newfile:
for line in oldfile:
if not re.search(bad_words, line):
newfile.write(line)
lines_seen = set() # holds lines already seen
outfile = open('cleankeywords.txt', "w")
for line in open('newfile.txt', "r", encoding="utf8"):
if line not in lines_seen: # not a duplicate
outfile.write(line)
lines_seen.add(line)
outfile.close()
Как мне сделать его более эффективным, удалить средний файл обрабатывается: newfile.txt
Так что оба действия происходят после того, как друг с другом , Кроме того, существует способ специфического расположения входного файла с использованием чего-то типа tkinter, а также имени выхода и каталога
Спасибо!
Используйте [регулярное выражение] (https://docs.python.org/2/library/re.html), чтобы проверить строку –
Вам даже не требуется регулярное выражение. –
'if all (i в string.ascii_letters + string.digits для i в строке): newfile.write (строка)' –