2015-12-03 6 views
0

У меня есть две коллекции Структура коллекции одного являетсяMongoDB обновить коллекцию, основанную на другой коллекции

{'click_id':"123345", 
... 
} 

Структура коллекции двух является

{'click_id':"123345", 
... 

} 

Каков оптимальный способ сделать в сборе 1

{'click_id':"123345", 
'collection2':true, 
... 
    } 

с учетом факта наличия около 1 миллиарда записей в коллекции 1 и около 30 миллионов записей в коллекции 2.

+0

Что относительно уникальности click_id в обеих сборниках? –

+0

click_id уникален в обеих коллекциях –

ответ

0

Насколько я знаю, вы не можете делать такие вещи, как JOIN из SQL DB на MongoDB.

Если ваша работа является пакетной, и вы можете думать о второй коллекции как о состоянии моментального снимка, вы можете просто загрузить все 30 миллионов идентификаторов в память (должно быть менее 1 ГБ, но это зависит от длины идентификаторов) в качестве словаря/карты.

Затем пройдите через все 1 миллиард записей из 1-й коллекции и сохраните результаты в Bulk insert/update (IDK, что вы хотите).

Смежные вопросы