У меня есть 3 набора данных, каждый из которых имеет 415 ГБ данных и разных доменов.Как достичь союза Все в свинье?
Мне нужно объединить все из них с помощью свиньи, но все, что я могу использовать, союз, который запускает редукторы в конце задания, чтобы удалить отдельные значения.
a = union a1, a2
data = union a, a3
Есть ли способ пропустить часть редуктора, поскольку данные уже различны.
Я не уверен, но сценарий, который я бегу только имея объединение трех различных файлов. –