Я столкнулся с ситуацией, когда мне приходилось подсчитывать количество вхождений каждого слова в строку. Я решил, что хеширование было бы лучшим способом сделать это (найдите значение хэша для каждого слова, которое встречается, и увеличивайте счет в позиции, индексированной хеш-значением, при условии, что я использую массив). Какой алгоритм хеширования я могу использовать, чтобы гарантировать, что хэш-значение, сгенерированное для каждой строки, уникально?алгоритм хеширования для строк
И это привело к большему вопросу .. Как языковые библиотеки (например, Java) реализуют структуры данных, такие как hashmap, которые генерируют уникальные значения хэша в случае строк?
Я хочу знать математическую конструкцию, связанную с реализацией такого алгоритма.
http://code.google.com/p/gphfa/ Содержит множество популярных алгоритмов для хешей String. – st0le