2011-05-19 2 views
0

У меня есть система, которая содержит капли содержимого и очень длинный список тегов (более 4000) содержимое анализируется отдельным приложением, затем извлекается частота и местоположение каждого тега, какая лучшая система баз данных для хранить огромное количество контента и тегов, которые затем позволяли бы искать такие теги?Какая лучшая база данных для хранения данных тегов и контента?

ответ

1

Я бы посмотрел на Lucene (и связанные проекты, такие как Solr и ElasticSearch) или Sphinx, то есть текстовые поисковые системы, а не на то, что вы обычно называете базой данных.

Эти двигатели предназначены для индексирования документов - капли текста, разбивая их на множество мелких компонентов («токенизация»). Проблема, которую вы описываете, - сохранение блоба и длинный список тегов - находится в этом домене.

Смежные вопросы