новинка на Python.Удалить дубликат, удалить определенные буквы из строки, если найдено
Я хочу удалить из дубликата строки файла, а также некоторые символы.
Например, у меня есть следующий файл:
A 786 65534 65534 786 786 786 786 10026/AS4637 19151 19151 19151 19151 19151 19151 10796/AS13706
B 786 65534 65534 786 786 786 3257 3257 3257 1257 1257 1257 1257 1257 1257 1257 49272
Нужный выход я хочу это:
A 786 10026 4637 19151 10796 13706
B 786 3257 1257 49272
Две вещи здесь происходит, сначала любую строку, которая имеет # 65000 должен быть удален , Во-вторых, иногда вы получаете два символа, разделенные символом «/», и у него есть нежелательные буквы, такие как #AS, которые я не хочу.
У меня есть следующий код:
import os
p = './testing/test.txt'
fin = open(p, 'r')
uniq = set()
for line in fin.readlines():
word = line.rstrip().split(' ')[3:]
if not word in uniq:
uniq.add(word)
print word
ips.close()
Я получаю:
TypeError: unhashable type: 'list'
Как вы можете видеть, что я даже не могу проверить, если слово больше, чем 65000, как я могу 't даже удалить дубликаты через set()
Пожалуйста, помогите нам в этом.
Пожалуйста, я мог бы реально использовать некоторую помощь здесь
Я предполагаю, что вы хотите сохранить один из '65534' s? – flornquake
Ничего больше, чем 65000 должно быть там. Надеюсь, это поможет. – user2802697