Полнотекстовый поиск не работает.Индекс и полнотекстовый поиск с помощью Jackrabbit, Lucene с использованием Tika
Я создаю систему управления документами с использованием Apache Jackrabbit 2.9.0 и Тика-парсеры 1,3
В workspace.xml & repository.xml добавил tikaConfig
<SearchIndex class="org.apache.jackrabbit.core.query.lucene.SearchIndex">
<param name="path" value="${wsp.home}/index"/>
<param name="supportHighlighting" value="true"/>
<param name="tikaConfigPath" value="${rep.home}/tika-config.xml"/>
</SearchIndex>
В tika- config.xml
<mimeTypeRepository resource="/org/apache/tika/mime/tika-mimetypes.xml" magic="false"/>
<parsers>
<parser name="parse-html" class="org.apache.tika.parser.html.HtmlParser">
<mime>text/html</mime>
<mime>application/xhtml+xml</mime>
<mime>application/x-asp</mime>
</parser>
</parsers>
</properties>
Добавлен файл Html в хранилище, как показано ниже (JcrUtils.putFile()) & тип Mime как
public static Node putFile(
Node parent, String name, String mime,
InputStream data, Calendar date) throws RepositoryException {
Binary binary = parent.getSession().getValueFactory().createBinary(data);
try {
Node file = getOrAddNode(parent, name, NodeType.NT_FILE);
Node content = getOrAddNode(file, Node.JCR_CONTENT, NodeType.NT_RESOURCE);
content.setProperty(Property.JCR_MIMETYPE, mime);
content.setProperty(Property.JCR_LAST_MODIFIED, date);
content.setProperty(Property.JCR_DATA, binary);
return file;
} finally {
binary.dispose();
}
}
Файл успешно добавлен и может быть считан обратно то же самое содержание "текст/html". также отлично работает. но когда полнотекстовый поиск не работает. проблема в индексировании?
Запрос JCR SQL2 ниже
"select * from [nt:resource] as x WHERE contains(x.*, '*session*')"
Помогите мне решить эту проблему, я гугле, но не может найти соответствующую проблему. Спасибо
"The" - это слово для остановки. Попробуйте более удобный поисковый запрос. – femtoRgon
Привет, femtoRgon, я также пробовал с другими, но не работал – user1159833
Поиск работает отлично по другим свойствам, но не с данными – user1159833