Я должен хранить tiff (формат файла изображения тегов) или файл в формате pdf в mongodb, который должен иметь текстовый поиск. например, если мы хотим искать «на основе текста», он должен иметь возможность искать.сохранение отсканированного файла (pdf, tiff, jpeg) в MongoDB.
Я собираюсь использовать .net mvc или java с mongodb.
так как я могу хранить этот файл pdf, а затем можно получить из базы данных.
любое предложение будет оценено.
благодаря
все в порядке. но если я следую первому пути, о котором вы говорили выше, могу ли я искать в файле? Основная цель - поиск в файле. –
В случае, если это pdf с текстом, вы можете извлечь весь текст и сохранить его seperatly, tiff и images, вам придется делать OCR и обрабатывать их отдельно, чтобы извлечь весь текст, по которому вы будете выполнять свои поисковые запросы. –