Я пытаюсь уменьшить изображение с помощью Neon. Поэтому я попытался использовать неон, написав функцию, которая вычитает два изображения с помощью неона, и я преуспел. Теперь я вернулся, чтобы написать билинейную интерполяцию, используя неоновые свойства. Прямо сейчас у меня есть две проблемы, получая 4 пикселя из одной строки и одного столбца, а также вычисляйте интерполированное значение (серое) с 4 пикселей или если это возможно из 8 пикселей из одной строки и одной колонки. Я пытался подумать об этом, но я думаю, что алгоритм должен быть переписан вообще?Билинейная интерполяция с C на Neon
void resizeBilinearNeon(uint8_t *src, uint8_t *dest, float srcWidth, float srcHeight, float destWidth, float destHeight)
{
int A, B, C, D, x, y, index;
float x_ratio = ((float)(srcWidth-1))/destWidth ;
float y_ratio = ((float)(srcHeight-1))/destHeight ;
float x_diff, y_diff;
for (int i=0;i<destHeight;i++) {
for (int j=0;j<destWidth;j++) {
x = (int)(x_ratio * j) ;
y = (int)(y_ratio * i) ;
x_diff = (x_ratio * j) - x ;
y_diff = (y_ratio * i) - y ;
index = y*srcWidth+x ;
uint8x8_t pixels_r = vld1_u8 (src[index]);
uint8x8_t pixels_c = vld1_u8 (src[index+srcWidth]);
// Y = A(1-w)(1-h) + B(w)(1-h) + C(h)(1-w) + Dwh
gray = (int)(
pixels_r[0]*(1-x_diff)*(1-y_diff) + pixels_r[1]*(x_diff)*(1-y_diff) +
pixels_c[0]*(y_diff)*(1-x_diff) + pixels_c[1]*(x_diff*y_diff)
) ;
dest[i*w2 + j] = gray ;
}
}
Правильная процедура понижающей дискретизации должна учитывать гораздо больше 4 пикселей для каждого выходного пикселя. Bilinear - неправильный подход, он не лучше, чем ближайший сосед в этом приложении. –
@MarkRansom Я пробовал нормальный сосед, но качество изображения повлияло на мои компьютерные программы видения. Лучшее, что подходит моему приложению, - это использование билинейной интерполяции, но проблема в медленной работе opencv. –
Билинейная система работает довольно хорошо в диапазоне + -50% масштабирования. С другой стороны, наблюдается пикселизация и сглаживание других конечных частот (например, эффект Муара). Узким местом в параллелизации/векторизации является необходимость доступа по меньшей мере к 4 «случайным» элементам памяти на пиксель и для генерации их эффективных адресов; и решение состоит в том, чтобы использовать pshufb для Intel и vtbl на Neon для доступа к отдельным байтам из 8, 16 или даже 32 (ymm) отдельных файлов. –