Я имею дело с большим списком (порядка 10^5) идентификаторов (которые являются длинными типами данных). Я должен найти дубликаты в списке идентификаторов. Но я ограничусь использованием рубина.Самый быстрый способ найти дублирующее число в большом списке
Здесь я нашел способ сделать это. Я пройду список и поставлю идентификатор в хэш, но прежде чем вставлять его в хэш, я проверю, что он уже находится в хеше или нет.
Я не уверен в сложности хеша в RUBY.
Пожалуйста, предложите мне лучшую идею.
Либо рубин, или что? – sawa
Ваша идея звучит неплохо. Это на самом деле медленно? Пожалуйста, поделитесь своими результатами. – Stefan
Что заставляет вас думать, что сложность хэшей в Ruby будет отличаться от других языков? Хеширование, как правило, считается временем O (1), если коэффициент нагрузки не слишком близко к 1. – pjs