Numpy удалять повторяющиеся строки

Мне просто нужно удалить строки, которые повторяются в массиве, но поддерживать один из них, я не могу использовать уникальный, потому что мне нужно поддерживать порядок. ПримерNumpy удалять повторяющиеся строки

мне нужен этот вывод

источник

2013-05-23 Alice

Являются ли ваши строки различимыми, например, первый, столбец? – Jan

Нет, они не ... Я сделал пример яснее – Alice

См. Вопрос относительно этого [здесь] (http://stackoverflow.com/questions/12926898/numpy-unique-without-sort). – hooy

Я думаю, это делает то, что вы хотите, и использует np.unique с аргументом return_index ключевого слова:

import numpy as np 

a = np.array([[1, 'a234', 125], 
       [2, 'b189', 547], 
       [1, 'a234', 125], 
       [3, 'c678', 567], 
       [1, 'a234', 125], 
       [2, 'b189', 547]]) 

b = a.ravel().view(np.dtype((np.void, a.dtype.itemsize*a.shape[1]))) 
_, unique_idx = np.unique(b, return_index=True) 

new_a = a[np.sort(unique_idx)] 

>>> new_a 
array([['1', 'a234', '125'], 
     ['2', 'b189', '547'], 
     ['3', 'c678', '567']], 
     dtype='|S4')

hackiest часть является вид b, который превращает каждую строку в один элемент np.voiddtype, так что l строк можно сравнить для равенства на np.unique.

источник

2013-05-23 16:13:46 Jaime

@Ali_Sce Вы не должны включать в свой код '>>>' и все после этого. – hooy

Я этого не делал ... Я новичок, но я пытаюсь понять вещи;) – Alice

Когда я запускаю его, мне нужно установить 'new_a = a [np.sort (unique_idx [1])]' иначе 'unique_idx 'был бы кортежем из двух массивов, а для остальных - совершенным! На самом деле хаки, по крайней мере для меня! – Alice

Numpy удалять повторяющиеся строки

ответ

Смежные вопросы