Оптимизация вложенного цикла цикла с двумя списками

У меня есть программа, которая выполняет поиск по двум отдельным спискам, позволяет называть их list1 и list2.Оптимизация вложенного цикла цикла с двумя списками

Я только хочу напечатать экземпляры, где list1 и list2 имеют соответствующие элементы. Дело в том, что не все элементы в обоих списках соответствуют друг другу, но первый, третий и четвертый элементы должны.

Если они совпадают, я хочу, чтобы полные списки (включая несоответствующие элементы) добавлялись к двум соответствующим спискам.

Я написал код следовать:

for item in list1: 
    for item2 in list2: 
     if (item[0] and item[2:4])==(item[0] and item2[2:4]): 
      newlist1.append(item) 
      newlist2.append(item2) 
      break

Это работает, но это очень неэффективно. Для некоторых из более крупных файлов, которые я просматриваю, для завершения матча может потребоваться более 10 секунд, и в идеале это должно быть не более половины.

Я думаю, что он не должен начинать с начала в списке2 каждый раз при запуске кода, этого должно быть достаточно, чтобы продолжить с последней точки, где было совпадение. Но я не знаю, как написать это в коде.

источник

2014-09-01 Halldinz0r

Знаете ли вы, что 'item [0] и item [2: 4]' будут равно 'item [0]', если 'item [0]' не false? – utdemir

@utdemir На самом деле он будет равен 'item [0]' _if_' item [0] 'оценивается как' False'; иначе он будет равен 'item [2: 4]' –

Вы правы; путать, извините. Но все же, ИМХО, это не похоже на то, что пытается сделать ОП. – utdemir

Ваше состояние (item[0] and item[2:4])==(item[0] and item2[2:4]) неправильно.

Кроме того, что второй item[0] должен вероятно быть item2[0], чем (item[0] and item[2:4]) делает следующее (аналогично для (item2[0] and item2[2:4])):

если item[0] является 0, она возвращает item[0] себя, т.е. 0
если item[0] является не 0, он возвращает все, что item[2:4] является

И это затем сравнивается с результатом второго слагаемого. Таким образом, [0,1,1,1] будет «равно» [0,2,2,2], а [1,1,1,1] будет «равно» [2,1,1,1].

Попробуйте использовать tuples вместо:

if (item[0], item[2:4]) == (item2[0], item2[2:4]):

Или использовать operator.itemgetter как предложено в другой ответ.

Чтобы ускорить парное сопоставление элементов из обоего списков, помещают элементы из первого списка в словарь, используя те кортежи, как ключ, а затем итерация над другим списком и поиск совпадающих элементов в словарь. Сложность будет O (N + M) вместо О (Н * м) (п и м быть длиной списков).

key = operator.itemgetter(0, 2, 3) 

list1_dict = {} 
for item in list1: 
    list1_dict.setdefault(key(item), []).append(item) 

for item2 in list2: 
    for item in list1_dict.get(key(item2), []): 
     newlist1.append(item) 
     newlist2.append(item2)

источник

2014-09-01 09:05:35

Большое спасибо, это очень полезно. Я не видел опечатку предмета и item2. Пробовав цикл, я фактически использовал кортежи в какой-то момент, и это, казалось, работало в любом случае, но полезно получить объяснение надежности использования кортежей. Кроме того, сейчас очень быстро, когда я перешел на использование словарей. Теперь мне просто нужно выяснить, что вы там сделали (я не программист) ... – Halldinz0r

from operator import itemgetter 

getter = itemgetter(0, 2, 3) 
for item,item2 in zip(list1, list2): 
    if getter(item) == getter(item2): 
     newlist1.append(item) 
     newlist2.append(item2) 
     break

Это может уменьшить немного времени сложности, хотя ...

источник

2014-09-01 08:59:24 Anvesh

Это сравнивает только элементы в тех же позициях списков; кажется, что OP хочет сравнить каждый элемент из списка1 с каждым элементом из списка2. –

Оптимизация вложенного цикла цикла с двумя списками

ответ

Смежные вопросы