0

У меня есть набор данных. Я хочу построить одноклассное распределение из этих данных. Основываясь на изученном распределении, я хочу получить значение вероятности для каждого экземпляра данных. Основываясь на этих значениях вероятности (пороговое значение), я хочу построить классификатор для классификации конкретного экземпляра данных, исходящего из этого дистрибутива или нет.обнаружение outlier на основе модели гауссовой смеси

В этом случае, скажем, у меня есть данные 50x100000, где 50 - размер каждого экземпляра данных, количество экземпляров - 100000. Я склоняюсь к модели Гауссовой смеси, основанной на этом распределении.

Когда я пытаюсь получить значения вероятности для экземпляров, я получаю очень низкие значения. Итак, в этом случае, как я могу построить clssifier?

+0

Почему вы используете модель смеси, если у вас есть только один класс = один компонент в смеси? –

ответ

1

Я не думаю, что это имеет смысл. Например, предположим, что ваши данные 1-мерные, и предположим, что истина состоит в том, что она была взята от bimodal distribution. Но предположим, вы не поняли, что это из бимодального распределения, и вы соответствуете нормальному распределению. Вы по-прежнему должны иметь наилучшую возможную форму, но это было бы наилучшим образом подходит для неправильного распределения, и правда в том, что ни один из пунктов не приходит из этого дистрибутива или из любого дистрибутива, который выглядит так.

Смежные вопросы