Я индексирую данные по elasticsearch, используя официальную библиотеку python для этого: elasticsearch-py. Данные напрямую берутся из oracle, используя библиотеку python cx_oracle, отбрасываются в формат документа и отправляются для индексирования в elasticsearch. По большей части это отлично работает, но иногда я сталкиваюсь с проблемами с такими персонажами, как ö. Иногда этот символ индексируется как \ xc3 \ xb8, а иногда как ö. Это происходит даже в той же записи базы данных. Одна переменная может иметь правильную индексацию ö, а для другой переменной это не так.Индексация Elasticsearch с проблемами Python UTF-8
Есть ли у кого-нибудь идеи, что может вызвать это?
заранее спасибо
При нажатии [реки] (https://www.elastic.co/guide/en/elasticsearch/rivers/current/index.html) говорится: ** Реки были устарели в Elasticsearch 1.5 и удалены в Elasticsearch 2.0. ** Просто из любопытства, любой другой способ отправить данные непосредственно в ES без скрипта? –
Поскольку реки устарели, вам придется использовать альтернативу, например, logstash. Посмотрите на это: http://stackoverflow.com/questions/29674974/alternatives-to-elasticsearch-river-plugins/ – Heschoon