У меня есть список пар значений ключа. Для каждого ключа я хочу видеть, насколько уникальными являются значения. Например, для конкретного ключа k1 все значения могут быть одинаковыми. (лучший случай). Для ключа k2 половина значений является одним типом, а другая половина отличается. . . Аналогично, для ключа kx ни одно из значений не соответствует (наихудший случай).Алгоритм реального мира - измерение уникальности входных значений
Я хочу присвоить каждому из этих ключей ранги (или проценты, что угодно) на основе вышеизложенного и иметь окончательный порядок, чтобы я мог отфильтровывать те, у которых много разных значений (скажем, выше предопределенного порогового ранга или процентов).
Я как-то думаю, что это несколько связано с некоторыми понятиями, которые я изучил в своем курсе интеллектуального анализа данных, но просто не могу вспомнить эффективно.
Спасибо.
Можете ли вы показать нам, что вы пробовали, и конкретную проблему, с которой вы сталкиваетесь? –
Единственная проблема, с которой я сталкиваюсь, я не могу вспомнить, какую категорию проблемы это. Я действительно не хочу решения. – dreamer13134
Ум, действительно ли это важно? О каких типах категорий вы думали? –