У нас есть алгоритм, который получает гипотетически длинный поток ключей. Затем он генерирует значение от 0 до 1 для каждого ключа, когда мы его обрабатываем, для последующего поиска. Набор ввода достаточно велик, и мы не можем позволить себе хранить одно значение для каждого ключа. Правило генерирования значений не зависит от ключей.Пространственно-эффективные вероятностные структуры данных для извлечения номера
Теперь предположит, что мы можем терпеть ошибки в заднем поиске, но мы хотим еще минимизировать разницы в извлекаться и исходных значений (т.е. асимптотический в течение многих случайных извлечений).
Например, если исходное значение для данной клавиши было 0,008, то получение 0,06 намного лучше, чем извлечение 0,6.
Какие структуры данных или алгоритмы мы можем использовать для решения этой проблемы?
Цветные фильтры - это самая близкая структура данных, о которой я могу думать. Можно было квантовать выходной диапазон, использовать фильтр цветения для каждого ведра и как-то объединить их выход во время поиска, чтобы оценить наиболее вероятное значение. Прежде чем перейти к этому пути и изобрести колесо, существуют ли какие-либо известные структуры данных, алгоритмы, теоретические или практические подходы к решению этой проблемы?
Я в идеале ищу решение, которое позволяет параметризовать обмен между пробелами и ошибками.
Можем ли мы сделать а также записать хеш-функцию для сопоставления каждого номера с определенным диапазоном. Значения в пределах диапазона могут управляться на основе коэффициента ошибки. –