Я не уверен, правильно ли я понял Term Vectors API.Требуется разъяснение API-интерфейса «Term Vector API»
Документ начинается словами:
Возвращает информацию и статистические данные о сроках в области конкретного документа. Документ может быть сохранен в индексе или искусственно предоставлен пользователем. Терминальные векторы по умолчанию являются реальными, а не в реальном времени. Это можно изменить, установив для параметра
realtime
значение false.
Я предполагаю, термин здесь есть ссылка на то, что некоторые другие люди могли бы назвать токенов может быть? Или термин, определенный к тому времени, когда мы попали сюда в документацию, и я пропустил его?
Затем документ продолжается, говоря, есть три секции к возвращаемому значению: информация Срок, Срочные Статистика и статистика полевых. Я предполагаю, что значение термин информация и статистика - это не единственное, что возвращает API, правильно?
Затем Информация о сроках содержит поле payloads
, которое не определено, и я понятия не имею, что это значит.
Тогда в статистики поля, есть сумма частот документа и суммы общих долгосрочных частот с довольно запутанным объяснением:
Установки field_statistics ложного (по умолчанию это правда) опускает :
количество документов (сколько документов содержат это поле)
сумму документа frequen Cies (сумма частот документа для всех членов в этой области)
суммы общих объем срочных частот (сумма общих долгосрочных частот каждого члена в этой области)
Я предполагаю, что они просто сумма по их соответствующим значениям, указанным в term statistics?
Затем в разделе Поведение он говорит:
Термин и полевые статистические данные не точны. Удаленные документы не принимаются во внимание. Информация извлекается только для осколка, в котором находится запрошенный документ. Поэтому термин и статистика поля полезны только как относительные меры, тогда как абсолютные цифры не имеют смысла в этом контексте. По умолчанию при запросе терминальных векторов искусственных документов случайно выбран случай, чтобы получить статистику. Используйте
routing
, чтобы попасть в конкретный осколок.
Итак, кто это? В реальном времени или нет? Или это то, что термин информация is realtime and term статистика и статистика поля - просто приблизительная реальность?