У меня есть тысячи Cvs, и я хочу найти резюме, имеющие «информатику» в качестве фона.Какая хорошая альтернатива для поиска Lucene?
Итак, я googled и узнал, что Lucene выполняет эту работу, и мне нужно передать данные Lucene, и она индексирует все документы.
При поиске конкретного текста (например, «Compuet science»), результат будет соответствовать совпадениям результатов.
Для этого мне нужно преобразовать MSword-93/MSword-2007/PDF в текст и передать Lucene.
я могу получить текст из MSword2007 документов, но я не могу получить от MSWord 2003
Есть много PDF писателей, но я не получил какой-либо PDF библиотеку для чтения, который может это делает.
Пожалуйста, пролишите свет на библиотеку PDF-ридера и конвертируйте документы ms93 в текст ИЛИ, пожалуйста, дайте мне знать, есть ли альтернативы для поиска Lucene.
Спасибо, большое спасибо за ответы
Вы спрашиваете здесь полдюжины вопросов. Пожалуйста, ограничьте сферу своего вопроса одной четко определенной темой. – deceze