У меня более миллиарда уникальных строк, представляющих имена пользователей, и я добавляю миллионы больше каждые несколько минут одновременно, более 50% дубликатов. В настоящее время я использую таблицу InnoDB с mySQL. Я использую INSERT IGNORE, но сервер просто не может справиться с нагрузкой одновременного добавления миллионов (с использованием особого экземпляра EC2 процессора). Для борьбы с этим я храню имена пользователей навалом, когда прихожу и обновляю уникальную таблицу с помощью службы, когда это возможно.1 миллиард уникальных строк при одновременном вводе миллионов
Я открыт для любых предложений, которые я могу разумно настроить на экземпляр ec2. Возможно, redis может достичь того, что я хочу сделать, но я еще не использовал его. Может ли кто-нибудь предложить наиболее эффективный способ хранения более миллиарда уникальных строк при добавлении миллионов?
Спасибо за ваш ответ, вы уверены, что блокировка индекса становится проблемой. Я не думал об использовании нескольких баз данных на разных машинах, но это очень новое решение. Это потребует от меня значительно больших ресурсов для достижения, но я не против этого. – Codewithcheese