2016-02-05 2 views
0

Я использую nutch, чтобы нажимать и индексировать данные в solr. В Nutch, я добавил abc.com:85 к домена-urlfilter.txt и +^http://abc\.com\:85 к регулярных выражений-urlfilter.txt.Nutch, чтобы разрешить, когда имя хоста имеет номер порта

Проблема заключается в том, что Nutch не индексирует данные и бросает это сообщение Общее количество адресов отвергнутых фильтров: 1

Здесь в URL, мне нужно номер_порта, эта конфигурация выполняется.

Не могли бы вы дать мне знать, как сделать работу с портом номер: 85 добавлено.

+0

Есть входы от любого – user3732294

ответ

0

Проблема заключается в следующем: +^http://abc\.com\:85 не соответствует действительности. Пожалуйста, проверьте синтаксис здесь: Nutch regex-urlfilter syntax

Надеется, что это помогает,

Le Куку Do

Смежные вопросы