У нас есть веб-служба, которая в настоящее время отвечает примерно на 3 миллиона HTTP-запросов в секунду. Каждый сервер на задней панели способен обслуживать около 5 миллионов запросов. Таким образом, бутылочная горловина - это передние концы HTTP.Стандартный протокол для мультиплексирования HTTP (для нескольких запросов)
Таким образом, проблема обращена к проблеме ситуации балансировки нагрузки. Мы решили проблему, позволяя многим серверам переднего плана суммировать входящие запросы в течение 1 миллисекунды. Как только полная миллисекунда будет достигнута для определенного сервера переднего конца, мы отправляем все запрошенные пакеты (около 100) на задний сервер с использованием существующего соединения с одним сокетом.
Это означает, что наши серверы back end получают запросы, содержащие сотни оригинальных HTTP-запросов и ответов с ответом, содержащим сотни запросов.
Существует ли стандартный протокол для мультиплексных/пакетных/агрегатных HTTP-запросов? Мультиплексирование в швах HTTP2 фокусируется на нескольких ответах на один запрос.