Скажите, что у вас есть большая коллекция с n объектами на диске и каждая имеет строку переменного размера. Каковы распространенные практики эффективных способов создания индекса этих объектов с простым сравнением строк. Хранение целых строк в индексе было бы непомерно высоким в размерах и вводе/выводе, но поскольку диски имеют высокую задержку хранения, то и ссылки не являются хорошей идеей.Эффективное хранение внешнего индекса строк
Я думал об использовании B-Tree-подобного дизайна с tries, но не смог найти реализацию базы данных с использованием этого подхода. На самом деле, это трудно найти, как крупные базы данных реализовать индексы для строк (это, вероятно, теряется в обширных результатах для информации SQL-уровня.)
ТИА!
EDIT: изменил название от «эффективной внешней сортировки и поиск сохраненных объектов с большими строками» к «эффективного хранение внешнего индекса строки.»
Да, он должен проходить по порядку, в частности найти диапазоны. Большое спасибо, наконец, реальный ответ. – alecco