2015-12-13 3 views
0

Я хочу создать поисковую систему. Я использую Lucene, это похоже на быстрые гонзали. Но у меня проблема. Когда я использую турецкие символы (ç, ş, ü, ö, ı,), мои слова, Lucene не возвращает никакого результата. Но когда я использую не-турецкий характер, я, по-моему, возвращает результат.Lucene and Turkish Characters

Как я могу решить эту проблему?

ответ

1

Возможно, вы захотите изучить FoldingFilter's и Analyzer's. Lucene может преобразовывать символы non-ascii в ascii, сохраняя их в индексе.

Не знаете, какую версию Lucene вы используете, вероятно, поможет выяснить, что происходит.

+0

Привет, Ник, спасибо за ваш ответ. Я использую Lucene 3.0.1. –

+0

Вы использовали Luke, чтобы посмотреть, как хранятся документы? Это поможет вам определить, насколько хранится текст или как изменяется текст запроса, что является проблемой. Кроме того, какие анализы вы используете при сохранении в настоящее время? Вы просто используете StandardTokenizer и StandardAnalyzer? – Nick

+0

Я скачал Люка и запустил его. Опять же, я запускаю тестовый запрос с турецкими символами, но не возвращаю никаких результатов ... Также я использую SimpleAnalyzer. –