Я вижу различные комбинации версий Nutch и Solr, которые люди публикуют по этой теме в Интернете. Каковы последние стабильные (не бета-версии) и совместимые версии Nutch и Solr, которые я могу загрузить и настроить без создания источников и просто настройки?Последние совместимые версии Nutch и Solr
ответ
Вы можете использовать Nutch 2.1 или Nutch 1.6. Если вы хотите использовать HBase, вам нужно использовать Nutch 2.x. Потому что nutch 1.6 не поддерживает Hbase. Я использую nutch 2.1, HBase 0.90.x или 0.94.5 и Solr 4.3.0.
Существуют значительные изменения между двумя версиями Solr (Solr 3.x и Solr 4.x). Вы должны выбрать один из них в соответствии с вашим требованием. Пример: поддержка Solr4 cloud
лучше.
Какая ОС вы используете?
В Windows Nutch 1.2 была последняя версия, с которой мне удалось работать.
В Linux Nutch 1.6 отлично работает с SOLR.
Это было в сочетании с SOLR 3.5 (из-за других зависимостей), но нет никаких оснований для того, чтобы он не работал с SOLR 3.6 или 4.3.
Я реализовал Nutch 1.6 и Solr 3.6.2 в систему производства ранее в этом году для крупной финансовой компании. Они отлично работают вместе.
, вы использовали Tomcat или Jetty для Solr? – MarioCannistra
Я использовал оба, и в обоих случаях они проксируются через Apache. – Claude
Привет Клод. Вы когда-нибудь пробовали Nutch 2.2.1 с HBase в производственную систему? – sunskin
Вот некоторые предложенные совместимые версии Nutch и Solr, основанные на том, что создатели Nutch в объявляют на своем веб-сайте here:
+-------+--------+
| Nutch | Solr |
+-------+--------+
| 2.3.1 | 4.10.3 |
| 2.3 | 4.8.1 |
+-------+--------+
Вы можете добавить больше вариантов. Инструмент, который я использовал для создания этой таблицы, можно найти here.
Я использую -
- Apache Nutch 2.3.1
- Solr 5.2.1
- HBase 0.94.14
И это комбинация работает отлично!
- 1. Hadoop, HBase и Apache Nutch совместимые версии
- 2. Интеграция Nutch и Solr
- 3. Nutch v Solr v Nutch + Solr
- 4. Интеграция Apache Nutch и Solr
- 5. Solr 5.0 и Nutch 1.10
- 6. Drupal + Nutch + Solr
- 7. nutch vs solr indexing
- 8. Nutch versus Solr
- 9. Совместимые коллекции - Solr 4/SOLRCloud
- 10. Nutch и Solr индексация домена черный список
- 11. Карта статического поля между nutch и solr
- 12. Solr и nutch. Как сохранить семя?
- 13. Solr 6 и Nutch 2.3.1 интеграция
- 14. nutch и solr для нескольких доменов
- 15. Совместимые версии для python и chameleon
- 16. Использование глушителя Nutch с Solr
- 17. Невозможно интегрировать Solr с Nutch
- 18. Совместимые версии: Ember, Ember Data, Handlebars
- 19. Как настроить Nutch и solr в ubuntu 10.10?
- 20. Интеграция nutch 1.11 с solr 6.0.1 cloud
- 21. Лучшая интеграция Tika на Solr или Nutch
- 22. Nutch не удаляет дубликаты от Solr
- 23. Как сделать подмоторы с SOLR & NUTCH?
- 24. Nutch Crawling Path - Просмотр хмеля в solr
- 25. Как настроить Nutch в Eclipse для SOLR
- 26. nutch сервер, который выводит на solr
- 27. Обнаружение языка в Solr для документов Nutch
- 28. Индексирование структуру в Solr с апача Nutch
- 29. Solr & Nutch - индексирование только определенных URL-адресов
- 30. solrindex способ сопоставления схемы nutch с solr
Я использую Ubuntu Server 12.04 LTS. Я только что попробовал SOLR 4.3.0 и Nutch 1.6. Оба работают (Solr работает в Tomcat и Nutch успешно обход небольшой сайт). Когда я попытался запустить команду Nutch solrindex, чтобы их интегрировать и проиндексировать обходной сайт с помощью solr, я получил java.io.IOException Job failed! ошибка. Не более подробная информация в журналах solr или nutch. Мне интересно, возможно ли это из-за несовместимости между двумя версиями ... – MarioCannistra
Версия Tomcat - 7 – MarioCannistra
Файл hadoop.log обычно имеет более подробную информацию. Можете ли вы опубликовать трассировку стека ошибки? Если нет более подробной информации, попробуйте изменить conf/log4j.properties и измените уровни отладки от INFO до DEBUG – nimeshjm