Как сканировать изображения в Nutch? Или есть ли другая открытая поисковая система, которая производит результаты с изображениями?Как сканировать изображения в Nutch?
2
A
ответ
0
изменить ваш regex-urlfilter.txt
в conf
- (ICO |. ICO | CSS | CSS | сидеть | SIT | EPS | EPS | WMF | WMF | застежка-молния | ZIP | РРТ | РРТ | XLS | XLS | GZ | GZ | мин | RPM | TGZ | TGZ | ех | EXE | JS | JS | GIF | GIF | PNG | PNG JPG || | JPG | JPEG | JPEG | BMP | BMP | мили на галлон | MPG | MOV | MOV) $
Удалить jpeg
, jpg
, gif
или type
изображение, которое вы хотите Grep.
А затем изменить suffix-urlfilter.txt
в conf
добавить #
к jpeg
, gif
или png
Это работало для меня!
Смежные вопросы
- 1. nutch - как сканировать определенный тип файла?
- 2. Как я могу сканировать страницу, но не получать видео/содержание изображения в nutch 2.1?
- 3. Как сканировать URL-адреса с помощью Apache Nutch?
- 4. Как заставить искателя Nutch сканировать только определенные URL-адреса?
- 5. Как сканировать документы PDF с помощью Nutch 1.6?
- 6. Как сканировать данные по нескольким темам, используя apache nutch?
- 7. Как сканировать веб-изображения google
- 8. Как сканировать 12-разрядные изображения?
- 9. Как сканировать и сравнивать изображения в Java
- 10. Nutch 1.10 не будет сканировать подкаталоги на моем сайте
- 11. Nutch - Сканировать страницу для ссылок, но не индексировать
- 12. Как ускорить сканирование в Nutch
- 13. Как сканировать SDK-изображения с помощью кода
- 14. Nutch - как проползать маленькими патчами?
- 15. Как запустить несколько экземпляров nutch?
- 16. Отключить проверку robots.txt в nutch
- 17. Как включить Nutch в простое приложение Java?
- 18. Как читать содержимое индекса Nutch?
- 19. Как запустить apache nutch в распределенном режиме
- 20. Nutch-Hadoop: - как мы можем сканировать только обновления в URL-адресе для повторного сканирования?
- 21. Как сканировать в PHP
- 22. Apache Nutch с Lucene
- 23. Как сканировать для URL изображения в результате запроса
- 24. Я хочу сканировать твиттер и facebook
- 25. Как сканировать веб-сайт с аутентификацией SAML с помощью ManifoldCF или nutch?
- 26. Как использовать Apache Spark с Apache Nutch
- 27. Сканировать ViewController для перемещения второго изображения после перетаскивания первого изображения
- 28. Использование Nutch как сканировать динамический контент веб-страницы, который является uisng ajax?
- 29. Как настроить nutch в затмении?
- 30. Как выбрать данные из определенных тегов в nutch
Это не работа для меня! –