2017-02-09 2 views
1

Я прочел ответ here. Но я не могу применить его на одном из моих примеров, поэтому я, вероятно, все еще не понимаю.Разница между контролируемым и неконтролируемым обучением при использовании PCA

Вот мой пример: Предположим, что моя программа пытается узнать PCA (анализ основных компонентов). Или процесс диагонализации. У меня есть матрица, и ответ на это диагонализация:

A = PDP -1

Если я правильно понимаю:

В поднадзорных обучения у меня будет все пытается с его ошибками

Мой вопрос:

  • Что я буду использовать в: Неактивированные обучения?

Будет ли у меня ошибка для каждого испытания, поскольку я иду в испытаниях, а не за все ошибки заранее? Или что-то еще?

+1

Возможного дубликат [? В чем разница между подконтрольным обучением и неконтролируемым обучением] (http://stackoverflow.com/questions/1832076/what-is-the-difference -between-supervised-learning-and-unsupervised-learning) –

ответ

3

Прежде всего, PCA не используется для классификации и кластеризации. Это инструмент анализа данных, в котором вы найдете основные компоненты данных. Это можно использовать для , например. уменьшение размерности. Контролируемый и неконтролируемый обучение не имеет значения здесь.

Однако PCA часто может применяться к данным до используется алгоритм обучения.

В контролируемом обучении у вас есть (как вы говорите) помеченный набор данных с «ошибками».

В неконтролируемого обучения у вас нет каких-либо ярлыков, т.е., вы ничего не можете проверить на всех. Все, что вы можете сделать, это как-то скопировать данные. Целью часто является создание кластеров, которые внутренне более однородны. Успех может быть измерен, , например., используя в пределах кластерного отклонения метрический.

+0

Но как может помочь кластеризация? возможно, ни один из наборов кластеров не является результатом PCA ... Я не понимаю, в чем смысл просто кластеризации. – user135172

+1

@ user135172 Забудьте о PCA, когда рассказываете о кластерном анализе, это яблоки и апельсины. ** Пример кластеризации: ** предположим, что вы делаете музыкальную рекомендательную систему, и вы хотите рекомендовать музыку, понравившуюся пользователям со схожим вкусом. Затем вы можете сгруппировать всех пользователей в соответствии с их музыкальными предпочтениями (_e.g._, используя DBSCAN). Затем, когда один пользователь должен быть рекомендован музыкой, вы представляете всю музыку, которую другие люди в пределах того же кластера, что и выбранный пользователь. Это неконтролируемое обучение. – Snps

+0

Я вижу, так, это как косвенная система? Я имею в виду, что в этом примере рецензента музыки, как будет выглядеть наблюдение за обучением, будет ли это система, которая напрямую проверяет типы музыки, а не косвенно проверяет людей с одним кластером? Разве это разница между контролируемым и неконтролируемым обучением? – user135172

1

Контролируемое обучение:

-> Вы отдаете по-разному обозначены примерные данные в качестве входных данных вместе с правильным ответом.

-> Этот алгоритм научится формировать его и начать предсказывать правильный результат на основе ввода.

пример:email spam filter


Неконтролируемое обучение:

-> Вы дали только данные и ничего подобного ярлыка или правильного ответа не сказать.

-> Алгоритм автоматически анализирует шаблон в данных.

пример:google news

Смежные вопросы