У меня есть два текстовых файла, назовите их A.txt и B.txt. Оба A.txt и B.txt имеют 3 поля. Но семантика отличается. Назовем эти поля следующим образом:Импорт из нескольких текстовых файлов в Solr
A.txt : f1, f2, f3
B.txt : f1, f2, f4
a.txt и b.txt имеют одинаковые значения для f1 и f2, но имеют различное третье поле.
Я хотел бы импортировать эти файлы в Solr (я использую Solr 4.5). Но оговорка в том, что соответствующие записи из A.txt и B.txt должны объединяться в один документ. Так, например, если мы имеем:
A.txt
1,50,foo
51,100,bar
B.txt
1,50,xkcd
51,100,qc
После dataimport произошло, там должно быть 2 документов в Solr:
1,50,foo,xkcd
51,100,bar,qc
Если документы хранятся в базах данных SQL, это было бы просто присоединиться запрос. Но так как документы хранятся в виде строк в CSV-файле, и я использую LineEntityProcessor с функцией трансформатора для выполнения dataimport, есть ли способ выполнить эту задачу?
Нет Solr 5. Вы имеете в виду Solr 4.5? Кроме того, каков ваш первичный ключ? Если вы сделали соединение, в каком поле/полях вы это сделаете? –
Извините, я имел в виду Solr 4.5. Мой первичный ключ - f1. Если бы я сделал соединение, я бы присоединился к f1 и f2. – dipteshc