Я разрабатываю приложение, которое будет принимать данные/события от систем, стоящих перед клиентами, для их аудита и использовать их как источник для воспроизведения сообщений в случае, если нисходящие системы нуждаются в коррекции в любом канале передачи данных.Запись производительности Cassandra с помощью Kundera ORM
Я не планирую много анализировать эти данные (что будет сделано в нисходящей системе). Но я должен сохранить эти данные и позволить запускать специальные запросы.
Немногие характеристики моей системы
(1) 99% от записи - 1% читают (2) высокую пропускную способность записи (примерно 30000 событий в секунду, каждое событие, имеющее примерно 100 атрибутов в нем) (3) Динамический характер данных. Не подходит для фиксированной схемы.
Эти характеристики заставляют меня думать о Apache cassandra в качестве опции либо с функцией расширения, либо с целью сохранения моих атрибутов.
Я сделал несколько выборок с единственным узлом и ORM Kundera для записи событий на карту и максимальную пропускную способность записи 1500 событий в секунду/поток. Я могу масштабировать его с большим количеством потоков и узлов кассандры.
Но, это близко к тому, что я должен получать от вашего опыта? Немногие из доступных тестов на сетях выглядят запутанными .. (Я на cassandra 2.0, с Kundra ORM 2.13)
Мне очень сложно дать ответ, так как ваш вопрос очень расплывчатый (и неясный), и поскольку мы понятия не имеем, как выглядит модель данных. –
Спасибо за ответ Седрик. Я смотрю, вижу ли я в правильном направлении (делает 1500 пишет/thread/node выглядит реально). –
Я не эксперт, поэтому я позволю кому-то еще ответить на реальный вопрос, но уверены, что предел 1500 из Cassandra или из вашего ORM/приложения? –