2015-10-13 4 views
1

У меня есть большая база данных греческих твитов, хранящихся в базе данных mongodb.MongoDB Text Index Unsupported Language

(3M Tweets arround 30GB хранения).

Я создал текстовый индекс в тексте и упорядоченный индекс в полях времени. Однако я обнаружил, что MongoDB не поддерживает греческий язык для индексации текста, поэтому текстовые запросы на греческом языке относительно медленны. Как я могу столкнуться с этой проблемой и создать инвертированный индекс также для греческих документов?

+1

хорошо [статья] (HTTP : //ngsiolei.blogspot.in/2010/11/basic-inverted-index-in-mongodb.html) –

ответ

0

Используйте solr для создания индекса, а не mongodb, у него есть много возможностей для поддержки многоязычного поиска.

0

Я только что обнаружил, что если я выберу язык как нет в соответствии с документацией, будет создан простой инвертированный индекс, использующий токенизацию.

http://docs.mongodb.org/manual/reference/text-search-languages/#text-search-languages

Если указать значение языковой «нет», то поиск текста использует простой лексемизацию без списка стоп-слов и не вытекающих