У меня есть файл, а ниже - фрагмент того, как он выглядит. У меня есть эти слова со связанным счетом. Как удалить дубликаты, которые имеют более низкий балл. Я имею в виду, что «свежий» имеет два счета (7.781 и 5.750), я пытаюсь удалить «свежие» и другие повторяющиеся термины с более низким счетом. Это возможно?Как удалить повторяющиеся термины с результатами из текстового файла?
['norwegian', 7.781341354126479]
['rp', 7.7802465301013]
['fresh', 7.7721646246757885]
['tick', 7.7721646246757885]
['wood', 7.7721646246757885]
['fresh', 5.750711529372451]
['tick', 4.750711529372451]
Я попытался сделать следующее, чтобы поместить файл в словарь и отделить слова и оценки.
from collections import defaultdict
d={}
last_seen=set()
with open("scored.txt","r") as filer:
for line in filer:
term, score= line.strip().split(",",1)
if line not in last_seen:
last_seen.add(line)
Где именно ваш код? – Vader
В вашем файле есть скобки и запятые? Кроме того, отправьте код, который вы попробовали. – mhawke
Добавлено. Да, файл находится в том же формате, что и выше. – minks