В Python 2.7, с тем чтобы получить набор уникальных строк из резервированного списка строк, то, что является предпочтительным (~ 10 миллионов строк длины ~ 20):питона - Sort & Unique против Набора
а) сортировать список и удалить повторяющиеся строки
sort(l)
unique(l) #some linear time function
б) просто положить их в наборе
set(l)
Обратите внимание, что я не заботиться о порядке строк.
Вы можете использовать 'timeit' модуль, чтобы быть 100% уверен, но я был бы очень удивлен, что а) работал быстрее, чем б), так как а) требует' O (n + nlogn) 'while b) только' O (n) ' – matino