2012-05-23 3 views
1

У меня есть список (> 50 000 слов). Каждое слово в списке имеет набор связанных псевдонимов (а). Каждое слово, в среднем, имеет 5 псевдонимов.Структура данных для поддержки больших наборов псевдонимов для быстрого поиска

Я получаю входную строку, усредняющую до 6 слов. Я должен сделать:

// Pseudocode 
foreach word in input_string 
    if word == x or word in alias(x) // x is a word in the list 
     tag (word, x) // Tag word with x 
    else 
     tag (word, 0) 
end 

Что такое быстрая структура данных, чтобы поддерживать список псевдонимов, который позволит быстрое выполнение выше посмотреть на него?

+0

У вас есть какие-либо пространственных ограничений? Если не простой словарь/hashmap даст вам хорошую производительность поиска –

+0

Любая сравнительная статистика для различных структур данных на таких поисковых системах? – check123

ответ

Смежные вопросы