Поэтому мне нужно выбрать набор идентификаторов документов и значение из таблицы, а затем дать вес для каждого из них в зависимости от значения. Она работает следующим образом:Выбор уникальных записей из таблицы и предоставление веса для повторений
Say таблица имеет значения:
DocID Value
1 1
1 1
2 1
2 2
Выбрать, подберет каждый уникальный DocID, а затем дать ему значение веса. Документ с тем же значением, который повторяется дважды, будет иметь меньший вес, чем документ с двумя разными значениями. Так выход будет что-то вроде этого:
DocID Weight
1 1.5
2 2
Итак, как вы видите, так как документ 1 имеет значение 1 повторяется два раза будет иметь начальный +1 к весу от первого значения, а затем +0,5, поскольку она повторяется один раз (снова получит +0.5, если значение повторится больше). Тогда Документ 2 имеет вес 2, так как значение 1 появляется один раз (+1), а значение 2 появляется один раз (+2)
Любая помощь будет высоко оценена.
Упрощенная версия помогла вам, спасибо. –