Это редактирование моего оригинального сообщения: я не думаю, что я четко изложил свою проблему.schema.xml конфигурация для имен файлов?
Мы получаем от наших поставщиков данные по изготовлению оборудования в XML-файлах. В обычный день мы получили 25 000 файлов. Вот почему я решил реализовать Solr.
Имена файлов состоят из одиннадцати полей, разделенных tildas как так
CTCA~PRE~PREP~1010123~ONTDTVP5A~41~P~R16-500~000912239878~20110125~212321.XML
Наши R & D ребята хотят быть в состоянии найти каждое поле имен файлов XML файлов (или операции), но они не» Не пытайтесь найти содержимое файла. В идеале, они хотели бы сделать запрос на все файлы, где «stbmodel», равный «R16-500» или «результат», «P» или «filedate» - «20110125» ... вы получаете эту идею.
Я определил в schema.xml каждого поля данных, как так (слева направо - извините за длинный список):
field name="location" type="textgen" indexed="false" stored="true" multiValued="false"/
field name="scriptid" type="textgen" indexed="false" stored="true" multiValued="false"/
field name="slotid" type="textgen" indexed="false" stored="true" multiValued="false"/
field name="workcenter" type="textgen" indexed="false" stored="false" multiValued="false"/
field name="workcenterid" type="textgen" indexed="false" stored="fase" multiValued="false"/
field name="result" type="string" indexed="true" stored="true" multiValued="false"/
field name="computerid" type="textgen" indexed="false" stored="true" multiValued="false"/
field name="stbmodel" type="textgen" indexed="true" stored="true" multiValued="false"/
field name="receiver" type="string" indexed="true" stored="true" multiValued="false"/
field name="filedate" type="textgen" indexed="false" stored="true" multiValued="false"/
field name="filetime" type="textgen" indexed="false" stored="true" multiValued="false"/
Кроме того, я определил, как уникальный ключ в поле «приемника». Но мои запросы не возвращаются. Я постарался обновить свой индекс следующим образом:
"java -jar apache-solr-1.4.1/example/exampledocs/post.jar *XML".
Я, очевидно, что-то пропустил. Есть идеи?.
Al.
PS: Следующий шаг - попробовать «solr.KeywordTokenizerFactory».