подход # 1: Вот на основе NumPy подход -
In [89]: a = np.array([1,1,1,1,1,1,1,2,2,2,2,2,2,2,3,3,3,3,3,3,3])
...: b = np.array([1,2,3,4,5,6,7,8,9,0,1,2,3,4,5,6,7,8,9,0,1])
...:
In [90]: idx = np.append(np.nonzero(a[1:] > a[:-1])[0], a.size-1)[:,None] - [2,1,0]
In [91]: b[idx].ravel()
Out[91]: array([5, 6, 7, 2, 3, 4, 9, 0, 1])
Если вы повторно ceiving те из столбцов dataframe, df
имени a
и b
соответственно, на стадии предварительной обработки, мы должны извлечь те, как массивы, как так -
a = df.a.values
b = df.b.values
Пожалуйста, обратите внимание, что это предполагает, по меньшей мере, три элемента за группу. Для случаев с меньшим, чем 3
elems на группу, читайте дальше к следующему подходу.
Подход № 2: С Scipy's binary dilation
создать маску для выбора элементов от b
-
from scipy.ndimage.morphology import binary_dilation as imdilate
def filter_lastN(a, b, N):
mask = np.zeros(a.size,dtype=bool)
mask[np.append(np.nonzero(a[1:] > a[:-1])[0],b.size-1)] = 1
return b[imdilate(mask,np.ones(N),origin=(N-1)//2)]
Пример запуска -
In [198]: a
Out[198]: array([1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3])
In [199]: b
Out[199]: array([5, 6, 7, 8, 9, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 0, 1])
In [200]: filter_lastN(a,b,3)
Out[200]: array([5, 6, 7, 2, 3, 4, 9, 0, 1])
In [201]: filter_lastN(a,b,5)
Out[201]: array([5, 6, 7, 0, 1, 2, 3, 4, 7, 8, 9, 0, 1])
подход 2 удивительно спасибо большое –