Я пытаюсь сравнить отдельные символы в строке в python, и я не уверен, как это сделать. В файле строк все строки принадлежат к группам, и я хочу определить, имеет ли 75% строк в группе один и тот же символ в данной позиции, и если это так, удалите все строки, полученные по сравнению с исходной строкой.Сравнение символов внутри строки
Я что-то вроде следующего мышления, сравнивая char2 в слове большой/ошибка:
count=0
group1_big
group1_big
group1_bigs
group1_bugs
group2_bug
for(string in file)
if(chars 1-7 of string == chars 1-7 of next string & char 9 is the same in both words)
if(75% are the same at position 9)
delete all other strings in the same group
В этом случае, если мы сравним символы 1-7, все GROUP1 матчи, и 75% имеют и 'i'
в позиции символа 9 удалить все, кроме первого. В результате в следующем выходе файла:
group1_big
group2_bug
А что, если у нас есть 2 группа слов, которая имеет такой же характер, в положении 9? Рассмотрим 'group1_big group1_big group1_bigs group1_bugs1 group1_bugs2 group1_bug3 group2_bug' – Kasramvd
Рассматривать как отдельные группы, только если это то же самое в группе должны все остальные члены группы будут удалены. –
Как группы записываются в файл? – ytpillai