2012-05-07 3 views

ответ

3

AFAIK TREC это аббревиатура для текста NIST в ПОИСКОВАЯ конференции. Чтобы индексирующее устройство могло знать, где границы документа находятся внутри файлов, каждый документ должен начинать документировать и заканчивать теги документа. Эти теги похожи на теги HTML или XML и на самом деле являются форматом документов TREC.

TrecParser: Этот анализатор распознает текст в полях TEXT, HL, HEAD, HEADLINE, TTL и LP.

Источник: TREC Wikipedia

Источник: Lemur Guide

0

Это также формат файла, используемый IBM Watson для получения информации

Смежные вопросы