Две недели назад у меня возникли проблемы с поиском Интернета для моего решения. Мне нужно интегрировать веб-приложение с Apache Solr и Apache tika, чтобы сделать фасетные PDF-файлы поиска, которые находятся в базе данных системы. Конфигурация solr и tika на моем сервере все в порядке, но поскольку я новичок в этих двух инструментах, я не уверен, как интегрировать друг друга, а также с приложением.Индексация PDF - Граничный поиск с Apache Solr и Apache Tika
0
A
ответ
1
Solr 6.2 поставляется с файлов например в например/файлов, настроенных специально для индексирования и просмотра файлов с форматированием (например, PDF).
Начните с использования этого и попытайтесь понять, как он собран.
Смежные вопросы
- 1. Apache Solr: Граничный поиск по многозначным полям
- 2. Как настроить Apache Tika с apache Solr 1.4.1
- 3. Как настроить Apache Tika и Apache Solr для индексации и поиска в каталоге файлов PDF?
- 4. Apache Tika и Apache PDFBox 2.0
- 5. Анализ данных с tika для apache solr
- 6. Интеграция Apache Tika и Apache Solr через API Java
- 7. Интеграция Apache TIKA и Solr Cell с Solr для индексирования pdf и текстовых документов
- 8. Индексирование текстовых файлов с помощью apache solr и tika
- 9. Solr Индексация и поиск
- 10. Apache Tika maxStringLength достигнуто
- 11. Расширенный поиск с Apache SOLR
- 12. Apache Tika extract отсканированные файлы PDF
- 13. Apache solr vs Apache Lucy
- 14. Apache Solr - индексирование файлов PDF
- 15. Apache и Apache Solr вместе
- 16. Разница между Apache POI api и Apache Tika Api?
- 17. Альтернативы Apache tika
- 18. Начало работы с Apache Tika?
- 19. Ошибка Apache Tika компиляции
- 20. Поиск книг в Apache Solr
- 21. Как проиндексировать документ PDF на Apache Solr
- 22. Удалить кеширование PDFont с помощью Apache tika
- 23. Как сравнить два pdf-документа с использованием Apache Tika
- 24. Извлечь изображения из PDF с помощью Apache Tika
- 25. Удаление специальных символов из текста/PDF с помощью Apache Tika
- 26. Разбор большого PDF-файла с использованием Apache Tika
- 27. Каковы преимущества применения Apache Tika для Solr вместо Nutch
- 28. Как читать PDF-закладку с помощью apache tika?
- 29. Как индексировать pdf/word doc в Apache SolR
- 30. Apache Solr не индексирует отсканированные PDF-файлы