Наша система недавно столкнулась с всплеском использования процессора, и основная причина пока неизвестна. В прошлом мы столкнулись с большим использованием памяти и оповещениями о дисках, поскольку мы запускаем ночную работу по индексированию большого объема, обновляя почти все наши документы. Но высокая загрузка процессора не была проблемой.Время отклика поиска удвоено неустойчиво
Данные, собранные до сих пор:
Узел 03 (из 6 узлов данных и 3 мастер) страдал от высокой загрузки процессора (> 95%) в течение 5 минут, в результате чего время отклика шип 1 сек, тогда как среднее время отклика составляет 40 мс. Просматривая метрики, в подсчете индекса на данном узле с высоким процессором наблюдался небольшой бамп, в то же время в Young GC наблюдался небольшой удар (в обоих случаях это не похоже на шип).
Я не исключаю интенсивную индексацию, так как у нас есть потребитель кафки, который принимает данные объемной индексации в любое время данных, но это контролируется со скоростью не более 250 документов в секунду с временем задержки 250 мс между каждым массовый вызов.
Кроме того, конечная точка горячей резьбы дала некоторые данные, хотя я еще не могу ее расшифровать.
Update
Обновлен заголовок вопроса, так как предыдущие наблюдения были неправильными. Основной проблемой является удвоенное время отклика и невысокое использование ЦП, поскольку через некоторое время использование стабилизировалось.
Было некоторое развитие. После всплеска потребление ЦП постепенно уменьшалось и было нормальным. Однако наше время отклика постоянно находится между 100-250 мс (обычное среднее значение - 35-100 мс).
В ответе в настоящий момент есть образец, близкий к зубам (не совсем однородный зубной паз).
Кроме того, был небольшой удар в старом графе GC, когда произошел всплеск.
Не найдено никаких аномалий в статистике узлов. Будет обновляться, когда будет найден. Все еще публикуется для расследования.
размещения Также в последнее время горячей нити -
Если у вас есть доступ к журналам, проверьте, какие запросы вы выполняли во время всплеска процессора. Результаты сортировки - интенсивность процессора. Возможно, вы выполняете запросы, которые возвращают огромное количество результатов. Просто догадка ... – jay
@jay У нас есть настройка бизнес-логики с жестко закодированными значениями размера результата. Также проверены журналы для любой анамолии. Не удалось найти ничего. –
Все горячие темы связаны с поиском. Неужели вы выбрали горячую нить во время всплеска? Были ли какие-либо изменения в ваших запросах? Скопления? Если у вас есть какая-либо настройка мониторинга на этих серверах, можете ли вы проверить, прошел ли Node 03 сильное слияние во время всплеска? – jay