У меня есть список (> 50 000 слов). Каждое слово в списке имеет набор связанных псевдонимов (а). Каждое слово, в среднем, имеет 5 псевдонимов.Структура данных для поддержки больших наборов псевдонимов для быстрого поиска
Я получаю входную строку, усредняющую до 6 слов. Я должен сделать:
// Pseudocode
foreach word in input_string
if word == x or word in alias(x) // x is a word in the list
tag (word, x) // Tag word with x
else
tag (word, 0)
end
Что такое быстрая структура данных, чтобы поддерживать список псевдонимов, который позволит быстрое выполнение выше посмотреть на него?
У вас есть какие-либо пространственных ограничений? Если не простой словарь/hashmap даст вам хорошую производительность поиска –
Любая сравнительная статистика для различных структур данных на таких поисковых системах? – check123