Я использую Kafka для обработки событий журнала. У меня есть базовые знания о потоках Kafka Connect и Kafka для простых коннекторов и потоковых преобразований.Kafka объединяет отдельные строки журнала событий в комбинированное событие журнала
Теперь у меня есть файл журнала со следующей структурой:
timestamp event_id event
Событие журнала имеет несколько строк журналов, которые соединены с помощью event_id (например, почтовый лог)
Пример:
1234 1 START
1235 1 INFO1
1236 1 INFO2
1237 1 END
И вообще есть несколько событий:
Examp le:
1234 1 START
1234 2 START
1235 1 INFO1
1236 1 INFO2
1236 2 INFO3
1237 1 END
1237 2 END
Временное окно (между START и END) может составлять до 5 минут.
В результате я хочу тема как
event_id combined_log
Пример:
1 START,INFO1,INFO2,END
2 START,INFO2,END
Каковы правильные инструменты для достижения этой цели? Я попытался решить это с помощью потоков Kafka, но я могу понять, как это сделать.
Спасибо за ответ. Я рассмотрю API-интерфейс Процессора. Да и проблема заказа должна быть рассмотрена. – imehl
Процессор API - это решение - еще раз спасибо! – imehl
@imehl: Возможно, вы хотите обновить свой вопрос выше с некоторой информацией о том, что вы на самом деле делали, чтобы решить вашу проблему, теперь, когда вы нашли решение? –