Чтобы разделить мои данные на основе ключа: Должен ли я использовать несколько тем или несколько разделов внутри одной и той же темы? Я спрашиваю на основе накладных расходов, вычислений, хранения данных и нагрузки, вызванной на сервере.Parallelism at Kafka Темы или разделы Уровень
ответ
Я бы рекомендовал разделить ваши данные на несколько разделов в одной и той же теме. Я предполагаю, что данные логически принадлежат вместе (например, поток событий щелчка). Преимущество разделения ваших данных с использованием нескольких разделов в рамках одной и той же темы в основном состоит в том, что все API-интерфейсы Kafka реализованы таким образом.
Разделение данных на темы, вероятно, приведет к значительному количеству кода в реализации производителя и потребителя.
Как было предложено в разделе «@rmetzger», разделение записей на несколько тем увеличило бы сложность на уровне производителя, но, возможно, некоторые другие факторы заслуживают рассмотрения.
В Кафке основным уровнем параллелизма является количество разделов в теме, потому что, чтобы вы могли создать много экземпляров-потребителей, чтобы параллельно считывать данные из одной и той же темы.
Например, если у вас есть отдельная тема, основанная на событии с N номером раздела, то при потреблении вы сможете создать N количество экземпляров потребителей, каждый из которых предназначен для одновременного использования из определенных разделов. Но в этом случае упорядочение сообщений не гарантировано.и.е. упорядочение сообщений теряется в присутствии параллельного потребления
С другой стороны, сохраняя записи в пределах той же теме в отдельном разделе будет сделать это намного проще для реализации и потребления сообщений в порядке (Кафка только обеспечивает общий порядок над сообщениями внутри раздела, а не между различными разделами в теме.). Но в этом случае вы будете ограничены только одним потребительским процессом.
- 1. kafka разные темы установить разные разделы
- 2. Разделы темы Kafka для Spark streaming
- 3. Как Kafka распространяет разделы темы среди брокеров
- 4. Просмотр сообщений через разделы Kafka
- 5. Как распространять существующие разделы темы kafka в другие каталоги?
- 6. Коннектор Kafka - JMSSourceConnector для темы Kafka
- 7. Сделайте Kafka Сохранение темы темы Постоянный
- 8. Kafka - Динамическое/произвольное разбиение на разделы
- 9. Kafka не заполняет разделы равномерно в теме
- 10. Темы для Android - это уровень приложения или уровень активности?
- 11. Стоимость перебалансировки разделов темы в Kafka
- 12. Кафка Высокий уровень Vs Низкий уровень потребительских
- 13. Kafka удаление темы не работает
- 14. ClassNotFoundException: org.apache.flink.streaming.api.checkpoint.CheckpointNotifier при потреблении темы kafka
- 15. Конфигурирование ACL для темы kafka
- 16. Ошибка создания темы Kafka на Windows 7
- 17. Ошибка чтения полей 'Темы': java.nio.BufferUnderflowException в Kafka
- 18. Уровень ядра и уровень пользователя Темы
- 19. Где kafka хранит разделы по темам?
- 20. Kafka создает разделы с использованием java API
- 21. Как разделы разбиты на Kafka Broker?
- 22. Как моделировать темы и разделы для Kafka при использовании для хранения всех бизнес-событий?
- 23. SimpleDB parallelism
- 24. Поддерживает ли Kafka приоритет для темы или сообщения?
- 25. Kafka Producer Java API не распространяет сообщения на все разделы темы
- 26. Репликация сообщений из одной темы Kafka в другую тему kafka
- 27. Можно ли добавить разделы в существующую тему в Kafka 0.8.2
- 28. Kafka: копировать темы между различными версиями?
- 29. , чтобы проверить существование темы kafka в nodejs
- 30. kafka NoClassDefFoundError kafka/Kafka