2012-05-06 2 views
2

Я использовал Lucene тест для того, чтобы измерить точность и вспомнить в исходном коде есть два файла, темы Файл:высчитывает точность и отзыв в Lucene с помощью регистратора

QualityQuery qqs[] = qReader.readQueries(new BufferedReader(new FileReader(topicsFile))); 

и qrelsFile:

Judge judge = new TrecJudge(new BufferedReader(new FileReader(qrelsFile))); 

Эти два файла являются текстовыми файлами, как я понимаю. Но я не знаю, что мне нужно, чтобы заполнить эти два файла, они написаны вручную мной или есть некоторый код, чтобы заполнить их необходимой информацией.

мне нужна помощь с этим точность и припоминания измерения в программе Lucene

благодаря

ответ

1

Javadocs для TrecJudge http://lucene.apache.org/core/old_versioned_docs/versions/3_4_0/api/all/org/apache/lucene/benchmark/quality/trec/TrecJudge.html

дает:

Судья, если данный документ имеет отношение к данному качественный запрос, основанный на формате Trec для суждений.

TREC (http://trec.nist.gov/) представляет собой серию конференций, которые предлагают конкурсы по информационному поиску.

Я подозреваю, что вам, возможно, придется выполнять некоторые из ваших собственных детективных работ, но это меня интересует, и я могу добавить дополнительную информацию.

В целом стратегия бенчмаркинг будет что-то вроде:

  • обеспечивает корпус, относящийся к интересующим вас области
  • аннотировать часть его, чтобы указать, что следует напомнить. Это может быть два набора: один с информацией (положительный) и один без (отрицательный)
  • разделите это на две части - один для обучения вашего приложения и один для его тестирования (есть более сложные подходы, которые требуют больше)
  • запустить программное обеспечение для оценки по вашему тестовому набору.

Вам, вероятно, понадобится предоставить ваш формат в формате TREC.

+0

Огромное вам спасибо, теперь это ясно для меня. Но у меня есть корпус с более чем 700 файлами. так как я понял, исходя из своей IR-системы, я должен указать для каждого запроса список файлов, имеющих отношение к нему (в результате поиска) и записать эту информацию в темыFile и qrlis file.is this Right ? действительно ценю вашу помощь. – Abreal

Смежные вопросы