Пожалуйста, помогите мне с этой большой проблемой с данными.Как улучшить производительность в большом столе?
У меня есть очень большая таблица (500G), в которой хранятся данные cookie, собранные с одного веб-сайта, и я стараюсь предоставлять услуги многим другим клиентам. Для каждого клиента у них есть свои файлы cookie, поэтому в конце мне нужно сделать запрос на 500G + 300G (client_data).
Поскольку некоторые запросы используют как данные моего файла cookie, так и данные cookie клиента, возможно, что мне нужно выполнить соединение между моей таблицей и их таблицей, поэтому производительность плохая. Чтобы решить эту проблему, я поставил все данные на 800 ГБ в гигантскую таблицу. Поскольку нет таблицы соединений, производительность хорошая. Но когда я расширяю свое обслуживание на несколько клиентов, он занимает слишком много места.
В настоящее время я использую Vertica в качестве источника данных и использую растровое изображение для хранения моей информации.
Любое предложение, которое может поддерживать мою текущую производительность, но также поддерживает как 40 пользователей? Мое хранилище составляет около 12 ТБ, и каждый клиент в текущем решении говорит 1.5T.
то, что я хочу, это замена Vertica с поддержкой поддержки растровой операции и быстрого соединения таблицы. Или лучший способ представить мои данные.