2013-03-19 3 views
0

мне нужно, чтобы уменьшить ненулевой массив типа:эффективно снижает большую np.array

a = np.zeros([10**4,10**4]) 

К меньшему числу размеров (столбцы) условным к простому ограничению типа:

a[column_index].sum() > threshold 

Я мог бы легко сделать это с помощью итерации и вызова .delete, но я действительно ищу что-то более эффективное (так как массив довольно большой). Любые намеки?

+0

Просто чтобы быть ясно, на «меньшее числе измерений «вы имеете в виду« меньше строк »? – NPE

+0

@NPE меньше столбцов – luke14free

ответ

3

сумма по оси 0, чтобы получить все столбцы суммы, а затем создать массив Его, чтобы выбрать столбцы:

import numpy as np 

a = np.random.randint(0, 100, [100,100]) 
b = a[:, a.sum(axis=0) > 5000] 
print b.sum(axis=0) 

выход:

array([5359, 5045, 5116, 5512, 5143, 5261, 5209, 5018, 5009, 5025, 5353, 
     5149, 5407, 5258, 5148, 5527, 5176, 5173, 5028, 5110, 5406, 5211, 
     5287, 5163, 5364, 5623, 5257, 5361, 5528, 5049, 5298, 5280, 5201, 
     5099, 5314, 5071, 5318, 5076, 5005, 5032, 5194, 5411, 5329, 5293]) 
+0

Действительно приятно, я точно искал пример такого типа фильтрации. Отличная работа. – luke14free