Что бы кто-нибудь считал наиболее эффективным способом слияния двух наборов данных с помощью Python?Слияние двух наборов данных в Python эффективно
Немного предыстории - этот код будет принимать 100K + записи в следующем формате:
{user: aUser, transaction: UsersTransactionNumber}, ...
и используя следующие данные
{transaction: aTransactionNumber, activationNumber: assoiciatedActivationNumber}, ...
создать
{user: aUser, activationNumber: assoiciatedActivationNumber}, ...
NB Эти не являются словарями Python, просто самое близкое к изображению re форма шнура.
Так что теоретически все, что я пытаюсь сделать, это создать представление о двух списках (или таблицах), соединяющих общий ключ - сначала это указывает на наборы (союзы и т. Д.), Но прежде, чем я начну изучать эти в глубине, они могут идти? До сих пор я чувствовал, что это может быть реализовано как:
Создать список словарей и перебирать список сравнения ключа каждый раз, однако, в худшем случае это может работать до LEN (inputDict) * LEN (outputDict) < - Не знаете?
Манипулировать данными в виде таблицы SQLite в памяти? Peferrably не так, как если бы не было строгого требования к Python 2.4, это облегчило бы жизнь.
Какой-то набор на основе магии?
Разъяснение
Вся цель этого сценария заключается в обобщении, фактические наборы данных поступают из двух различных источников. Номера пользователей и транзакций поступают в виде CSV в качестве результата теста производительности, который проверяет пропускную способность кода активации электронной почты. Второй набор данных - это разбор тестовых почтовых ящиков, содержащих идентификатор транзакции и код активации. Результатом этого теста является CSV, который будет перекачиваться обратно в этап 2 теста производительности, активируя учетные записи пользователей, используя коды активации, которые были в паре.
Извините, если мои записи для записей были вводят в заблуждение, я обновил их соответствующим образом.
Спасибо за ответы, я собираюсь дать две идеи попробовать:
- Сортировка списков первой (я не знаю как дорого это)
- Создание словаря с transactionCodes как ключ затем сохранить имя пользователя и код активации в списке в качестве значения
Пе rformance не слишком первостепенно для меня, я просто хочу попробовать и получить хорошие привычки с помощью Python Programming.
Я бы сказал, что вся запись должна быть сохранена в базе данных с самого начала. – kennytm