2013-02-13 2 views
1

Мы создаем функцию поиска в нашем приложении для прохождения более чем 100 000 xml-файлов для контента. Данные содержатся в виде огромного количества XML-файлов.Поиск содержимого в огромном количестве файлов в java

Это хорошая идея, чтобы хранить огромное количество xml-файлов и поиска (например, по имени и т. Д.) Через каждый файл для получения результата? Это может снизить эффективность поиска приложений.

Или что такое лучший способ?

+1

Использовать соль/люцен. – Bohemian

+0

Поиск 100 000 неиндексированных xml-файлов для данных никогда не будет лучшим способом сделать что-либо (особенно, если вы планируете искать через них все для каждого поиска). Вы должны прочитать эти данные в базу данных или какой-либо другой поиск по индексу, чтобы вы могли найти нужную вам информацию. – jzworkman

ответ

1

Вы хотите elasticsearch здесь. Это даст вам то, что вам нужно.

+0

Rick Will elasticsearch работает для поиска содержимого файла? Можете ли вы направить меня к примеру, если таковые имеются? – Nishant

+0

Абсолютно. Это то, для чего строится elasticsearch. Начните с этого урока: http://www.elasticsearchtutorial.com/elasticsearch-in-5-minutes.html. Как только вы закончите с этим, вы хотите посмотреть плагин привязки вложений. Для этого просто найдите на elasticsearch.org. ES может взять файл, переданный в виде строки, полностью проиндексировать его и немедленно сохранить его содержимое для поиска. – mightyrick

+0

Большое спасибо за ответ ... Это помогает мне много .. – Nishant

Смежные вопросы