Как указано в документации по повышению точности распознавания текста https://code.google.com/p/tesseract-ocr/wiki/ImproveQuality#Noise снижения шума на растровом изображении очень важно так,Android: Изображение Удаление шума
У меня есть этот код, который я ссылается здесь.
image processing to improve tesseract OCR accuracy
И я модифицировал и отлажена код, чтобы выглядеть примерно так:
public Bitmap RemoveNoise(Bitmap bmap)
{
for (int x = 0; x < bmap.getWidth(); x++)
{
for (int y = 0; y < bmap.getHeight(); y++)
{
int pixel = bmap.getPixel(x, y);
if (pixel.R < 162 && pixel.G < 162 && pixel.B < 162)
bmap.setPixel(x, y, Color.BLACK);
}
}
for (int x = 0; x < bmap.getWidth(); x++)
{
for (int y = 0; y < bmap.getHeight(); y++)
{
int pixel = bmap.getPixel(x, y);
if (pixel.R > 162 && pixel.G > 162 && pixel.B > 162)
bmap.setPixel(x, y, Color.WHITE);
}
}
return bmap;
}
Моя задача состоит в том, что после отладки кода у меня есть ошибки на pixel.R, pixel.G и pixel.B, и именно там я подключен прямо сейчас. Кроме того, может ли это быть лучшим алгоритмом или подходом к удалению шума из изображения. Благодаря