Спецификация производительности для обработки повторяющихся ключей в двоичном дереве поиска

Я читал книгу Введение в алгоритмы поиск лучших способов обработки повторяющихся ключей в двоичном дереве поиска.Спецификация производительности для обработки повторяющихся ключей в двоичном дереве поиска

Там несколько способов, указанные для этого случая использования:

Keep булево флаг x:b в узле x, и установить x к либо x:left или x:right на основе значения x:b, который чередуется между FALSE и TRUE каждый раз, когда мы посетим x, вставляя узел с тем же ключом, что и x.
Сохраните список узлов с равными ключами на x и вставьте 'в список.
Произвольно установлено x либо x:left, либо x:right.

Я понимаю, каждая реализация имеет свои хиты производительности/промахи, и STL может реализовать его по-разному от Boost Containers.

Является ли ограничение производительности упомянутым в спецификации C++11 наихудшей производительностью обработки дубликатов ключей, например, для multimap?

источник

2015-02-02 basav

FWIW, я являюсь поклонником варианта 2 - хотя для каждого узла может потребоваться дополнительный указатель, он наглядно иллюстрирует ваше намерение другим, кто может проверять/поддерживать ваш код , – Bukes

ya, даже я бы предпочел бы это, но тогда он был бы линейным во времени, и, как вы упомянули, тоже вызвало бы некоторое пространство. – basav

Если вы делаете это для удовольствия, то нет никакой разницы. Если вы заботитесь о производительности, то «неупорядоченные», «навязчивые» и «плоские» версии мультиплексоров и мультимножеств часто избивают бинарные древовидные. –

С точки зрения времени вставки/удаления 2 всегда лучше, потому что это не увеличит размер дерева и не потребует сложных изменений структуры при вставке или удалении дубликата.

Вариант 3 является оптимальным пространством, если имеется небольшое количество дубликатов.

Вариант 1 потребует хранения 1 дополнительный бит информации (которая, в большинстве реализации занимает 2 байта), но высота дерева будет оптимальным по сравнению с 1.

TL; DR: Реализация 2 является немного сложно, но стоит, если количество дубликатов велико. В противном случае используйте 3. Я бы не использовал 1.

источник

2015-02-03 06:58:11 ElKamina

Спецификация производительности для обработки повторяющихся ключей в двоичном дереве поиска

ответ

Смежные вопросы