2011-07-14 8 views
0

В моей компании собрано около 3500 высокоструктурированных документов Word (и растет), которые содержат вопросы с несколькими вариантами выбора из одного из наших продуктов. Мне было поручено написать интерфейс, который позволит людям находить и использовать их в других продуктах. На них есть метаданные, которые будут поступать в базу данных, но нам также нужен полнотекстовый поиск.RAILS3: Полнотекстовый поиск Word Docs?

Мне предоставили возможность использовать для интерфейса либо MS Access (потому что я это хорошо знаю), либо Rails (потому что я должен его изучать). Я сделал одно приложение Rails и предпочитаю продолжать его.

Вместо того, чтобы загружать документы в базу данных, я думал, что имеет смысл просто иметь их в файловой системе и хранить пути к ним в базе данных.

Я знаю, что я могу использовать Ferret для поиска полей базы данных, но что является лучшим способом добавить полнотекстовый поиск в приложение Rails для кучи файлов в файловой системе?

ответ

0

Не уверен, есть ли какие-либо драгоценные камни, которые будут искать файлы слов для вас. Хотя вы упомянули, что не хотите загружать все документы в базу данных, вы можете просто копировать текстовое содержимое каждого файла в своем db. Вы можете использовать библиотеку win32ol для этого (http://ruby-doc.org/stdlib/libdoc/win32ole/rdoc/classes/WIN32OLE.html). Если бы мне пришлось это реализовать, я бы запускал работу cron каждую ночь (или какая-либо частота кажется подходящей), которая обновит содержимое базы данных с изменениями в файлах слов.

+0

Спасибо, что ответили, Аникет! Я думаю, что я действительно думал больше о хорошей поисковой системе, которая будет индексировать файлы, а затем взаимодействовать с индексом в моем приложении Rails, чтобы находить и отображать хиты. У нас скоро будет встреча, чтобы хэшировать лучший способ сделать это, чтобы все было в воздухе на данный момент. Я могу положить содержимое в поля БД. –

Смежные вопросы