Я о индексировать твиты ближайших от Apache Nifi до Elasticsearch, как POST и хочу сделать следующее:Elasticsearch: Индексация твито - отображение, шаблон или ETL
Сделать
create_at
поля даты. Должен ли я использовать шаблон отображения или индекса для этого?сделать некоторые поля не проанализированными. Как хэштеги, URL-адреса и т. Д.
Хотите сохранить не весь твит, а некоторые важные поля. Как и текст, не все данные пользователя, а некоторые поля, хэштеги, URL-адреса от объектов (в почтовых URL-адресах). Не нужно указывать источник. И т. Д. Что следует использовать в этом случае? шаблон? Предварительно обрабатывать твиты с некоторым процессом ETL, чтобы извлекать нужные мне данные и индексировать их в ES?
Я немного смущен. Полюбуйтесь посоветовать.
Заранее спасибо.
В пункте 2, я не уверен, что вы подразумеваете под «каналом»? Вы имели в виду анализ? – Val
В сообществе NiFi есть несколько человек, которые заинтересованы в интеграции с поиском Elastic. Там были разговоры о импортере объема, чтобы получить данные от NiFi до ES и механизм запроса для получения данных от ES до NiFi. Если вы заинтересованы в сотрудничестве или имеете какие-либо вопросы, дайте нам знать [email protected] Спасибо –
Привет, Джо, В # 2 Я хочу, чтобы некоторые поля не анализировались. Было бы неплохо иметь процессор ES. Танк для электронной почты. –