У меня есть два массива numpy a
и b
, с двадцатью миллионами элементов (число с плавающей точкой). Если элементы комбинации этих двух массивов одинаковы, мы называем это дубликат, который следует удалить из двух массивов. Например,удалить дубликаты элементов из двух массивов numpy
a = numpy.array([1,3,6,3,7,8,3,2,9,10,14,6])
b = numpy.array([2,4,15,4,7,9,2,2,0,11,4,15])
Из этих двух массивов, мы имеем a[2]&b[2]
такие же, как a[11]&b[11]
, то мы называем его дублировать элемент, который должен быть удален. То же, что и a[1]&b[1]
vs a[3]&b[3]
Хотя каждый массив имеет повторяющиеся элементы, они не рассматриваются как повторяющиеся элементы. Поэтому я хочу, чтобы возвращаемые массивы были:
a = numpy.array([1,3,6,7,8,3,2,9,10,14])
b = numpy.array([2,4,15,7,9,2,2,0,11,4])
У любого человека самый умный способ реализовать такое сокращение?
'б [а = Ь! ] 'и' a [a! = b] 'будут работать? – Zero
Я пробовал, он не работает должным образом. –
А, неправильно прочитал вопрос, 'np.vstack ({tuple (row) для строки в np.column_stack ((a, b))})' должен работать, может не дать ваш первый уникальный порядок элементов. – Zero