2011-02-11 3 views
0

Это редактирование моего оригинального сообщения: я не думаю, что я четко изложил свою проблему.schema.xml конфигурация для имен файлов?

Мы получаем от наших поставщиков данные по изготовлению оборудования в XML-файлах. В обычный день мы получили 25 000 файлов. Вот почему я решил реализовать Solr.

Имена файлов состоят из одиннадцати полей, разделенных tildas как так

CTCA~PRE~PREP~1010123~ONTDTVP5A~41~P~R16-500~000912239878~20110125~212321.XML 

Наши R & D ребята хотят быть в состоянии найти каждое поле имен файлов XML файлов (или операции), но они не» Не пытайтесь найти содержимое файла. В идеале, они хотели бы сделать запрос на все файлы, где «stbmodel», равный «R16-500» или «результат», «P» или «filedate» - «20110125» ... вы получаете эту идею.

Я определил в schema.xml каждого поля данных, как так (слева направо - извините за длинный список):

field name="location"  type="textgen"   indexed="false" stored="true" multiValued="false"/ 
    field name="scriptid"  type="textgen"   indexed="false" stored="true" multiValued="false"/ 
    field name="slotid"   type="textgen"   indexed="false" stored="true" multiValued="false"/ 
    field name="workcenter"  type="textgen"   indexed="false" stored="false" multiValued="false"/ 
    field name="workcenterid" type="textgen"   indexed="false" stored="fase" multiValued="false"/ 
    field name="result"   type="string"   indexed="true" stored="true" multiValued="false"/ 
    field name="computerid"  type="textgen"   indexed="false" stored="true" multiValued="false"/ 
    field name="stbmodel"  type="textgen"   indexed="true" stored="true" multiValued="false"/ 
    field name="receiver"  type="string"   indexed="true" stored="true" multiValued="false"/ 
    field name="filedate"  type="textgen"   indexed="false" stored="true" multiValued="false"/ 
    field name="filetime"  type="textgen"   indexed="false" stored="true" multiValued="false"/ 

Кроме того, я определил, как уникальный ключ в поле «приемника». Но мои запросы не возвращаются. Я постарался обновить свой индекс следующим образом:

"java -jar apache-solr-1.4.1/example/exampledocs/post.jar *XML". 

Я, очевидно, что-то пропустил. Есть идеи?.

Al.

PS: Следующий шаг - попробовать «solr.KeywordTokenizerFactory».

ответ

0

Не могли бы вы просто добавить их в виде отдельных полей. Поэтому, когда вы переходите к вставке данных, вставьте с записью соответствующие поля, которые вы хотите выполнить. Так что не думайте об этом при поиске имен файлов, подумайте о именах файлов, как о том, как поля данных совпадают с содержимым файла.

Смежные вопросы