У меня возникла проблема с составлением словаря на языке python. Мой код проходит через каждое слово в документе объемом около 2,3 МБ и проверяет, находится ли оно в словаре, если оно нет, оно добавляется к спискуСамый быстрый способ проверить, есть ли элемент в списке - Python
Проблема заключается в том, что она занимает много времени (Я даже не получил его до конца). Как я могу это решить?
Код:
words = [("_", "hello"), ("hello", "world"), ("world", "."), (".", "_")] # List of a ton of tuples of words
vocab = []
for w in words:
if not w in vocab:
vocab.append(w)
Сколько слов у вас есть? Любой, почему бы не использовать 'set()' вместо списка? – Dekel
Вы можете предоставить копию слов, которые вы проверяете. – TheLazyScripter
слова на самом деле являются списком кортежей (n-граммов) –