У меня есть топология из трех частей, которая имеет серьезные проблемы с задержкой, но у меня возникли проблемы с выяснением того, где.штормовой поиск источника (ов) латентности
Кафка -> дб поиска -> записи Кассандре
чисел от взгляда шторма UI, как это:
(я вижу, что болты работают на> 1,0 мощности)
Если латентность процесса для двух болтов составляет ~ 65 мс, почему «полная латентность»> 400 сек? «Неверные» кортежи исходят из тайм-аутов, которые, как я подозреваю, так как значение латентности постоянно увеличивается.
Кортежи подключены через shuffleGrouping.
Cassandra живет на AWS, поэтому в пути могут быть ограничены сети.
У штурмового кластера есть 3 машины. В топологии работают 3 человека.
1. Нагрузка процессора на системы диспетчера составляет <.1 - они в основном работают на холостом ходу. 2. Это был решающий фактор. Установка его на 500 сделала разницу (см. Изображение в моем ответе) 3. См. № 1 4. Оказывается, что кассандра не заботится о пакетных вставках 5. см. # 2 – ethrbunny
@ethrbunny я проверил руководство и фактически представила емкость количество времени, затрачиваемого на болт, а не на использование процессора. Что касается кассандры, у вас все еще есть запах латентности, пакетная вставка может сделать вашу персистор быстрой, что быстрая вставка 1000 * 1 запись * 30 мс или запись 10 * 100 * 100 мс? Вы должны учитывать время, в течение которого пакеты должны путешествовать, подумать о сети и быть подтвержденными. –
@ethrbunny полная латентность этой топологии - это огромное значение, потому что следующий кортеж только вставлен в casandra после того, как предыдущий был вставлен, это вызовет огромную латентность ack. –