Из коробки Nutch индекс автора для elasticsearch создает индекс в elasticsearch с именем, представленным в Nutch-site.xml (или Nutch-default.xml) в свойстве элемента:Как изменить шаблон индекса, используемый указателем индекса nutch для elasticsearch?
<property>
<name>elastic.index</name>
<value>nutch</value>
<description>Default index to send documents to.</description>
</property>
Отображение раздела в elasticsearch такого автоматически генерируемым индекс всегда имеет следующую структуру
{
"nutch": {
"mappings": {
"doc": {
"properties": {
"anchor": {
"type": "string"
},
"boost": {
"type": "string"
},
"cache": {
"type": "string"
},
"content": {
"type": "string"
},
"contentLength": {
"type": "string"
},
"date": {
"type": "date",
"format": "dateOptionalTime"
},
"digest": {
"type": "string"
},
"host": {
"type": "string"
},
"id": {
"type": "string"
},
"lang": {
"type": "string"
},
"lastModified": {
"type": "date",
"format": "dateOptionalTime"
},
"segment": {
"type": "string"
},
"title": {
"type": "string"
},
"tstamp": {
"type": "date",
"format": "dateOptionalTime"
},
"type": {
"type": "string"
},
"url": {
"type": "string"
}
}
}
}
}
}
- Где шаблон для этого?
- Можно ли его изменить?
- Если да, то какие поля являются обязательными и необязательными?
- Где я могу найти дополнительную информацию об этом?
Любая помощь оценена! Спасибо, Wolfram
На самом деле я сначала рассмотрел исходный код индексатора - и, как вы сказали, ссылки на шаблон отсутствуют. Я думаю, что мне не хватало список полей, которые были проиндексированы/сохранены Nutch, о которых вы упомянули (в их вики). Таким образом, также в зависимости от того, что вы включили в списке плагинов в файле nutch-site.xml, писатель индекса nutch будет генерировать сопоставления elasticsearch на основе такого списка полей. Проверяя сгенерированные сопоставления, вы также можете заключить, какие плагины будут успешно включены (или нет). Полученные в результате отображения могут, в свою очередь, быть найдены в elasticsearch, как и я; правильно? – wbartussek
Да, это правильно! – Val
Неужели вам удавалось пробовать это до сих пор? – Val