1

Я изучаю мой класс обучения (ML), и у меня есть вопрос, что я не мог найти ответ с моими текущими знаниями. Предположим, что у меня есть следующий набор данных,Машиноведение, классификация

att1 att2 att3 class 
5 6 10 a 
2 1 5 b 
47 8 4 c 
4 9 8 a 
4 5 6 b 

Приведенные выше данные посаженные ясно, и я думаю, что я могу применить алгоритмы классификации новых входящих данных после того, как я тренирую свой набор данных. Поскольку каждый экземпляр имеет метку, легко понять, что каждый экземпляр имеет класс, помеченный знаком. Теперь, мой вопрос заключается в том, что если бы у нас был класс, состоящий из разных экземпляров, таких как данные распознавания жестов. Любой класс будет иметь несколько экземпляров, которые задают его класс. Например,

xcor ycord depth 
45 100 10 
50 20 45 
10 51 12 

выше трех случаев принадлежат к классу А и ниже трех случаев принадлежат к классу В качестве группы, я имею в виду эти три экземпляра данных составляет этот класс вместе. Для данных жестов - координаты движения вашей руки.

xcor ycord depth 
45 100 10 
50 20 45 
10 51 12 

Теперь, я хочу, чтобы все входящие три экземпляра были сгруппированы либо как A, либо B? Можно ли пометить все из них либо A, либо B без маркировки каждого экземпляра самостоятельно? В качестве примера предположим, что следующая группа принадлежит B, поэтому я хочу, чтобы все экземпляры были помечены вместе как B не индивидуально из-за их независимого сходства с классом A или B? Если это возможно, как мы это называем?

xcor ycord depth 
45 10 10 
5 20 87 
10 51 44 

ответ

2

Я не вижу сценарий, в котором вы можете группировать неопределенное количество строк в вашем наборе данных как функции данного класса. Они либо независимо связаны с классом, либо все функции и, следовательно, уникальная строка. Что-то вроде:

Instead of 
xcor ycord depth 
45 10 10 
5 20 87 
10 51 44 

Будет что-то вроде:

xcor1 ycord1 depth1 xcor2 ycord2 depth2 xcor3 ycord3 depth3 
45  10 10  5 20  87  10  51 44 

Это в значительной степени тот же самый подход, который используется для моделирования временных рядов

+0

Спасибо. То, что я пытался узнать, было так просто. Я только начал учиться для своего класса, и мне было просто интересно, как я смогу смоделировать свои данные, если у меня возникнет такая проблема. Я просто не мог понять сам. –

+0

@JohnDavid Нет проблем, у всех нас есть такие сомнения в какой-то момент. Я просто не был уверен, что это именно то, что вы хотели знать. Ура! – Pedrom

1

Заглянуть при использовании neural networks for recognizing hand-written text. Вы можете придумать жест как рукописную цифру с дополнительным компонентом времени (так что дайте каждому пикселю «возраст».) Если ваши данные обучения также содержат похожие данные времени, я думаю, что техника должна хорошо переноситься.

+0

К примеру, у нас есть онлайн рукописный текст распознавание данных. Вероятно, он будет содержать координаты (x, y) данных для каждого хода. Таким образом, группа экземпляров будет помечена как A, а другой набор экземпляров будет помечен как B. Таким образом, для произвольного набора координат мы можем классифицировать все входящие координаты как A или B без маркировки каждой отдельной координаты как A или B? Если вы меня не понимаете, неважно. может быть, я до сих пор не знаю достаточно хорошо, о чем говорю. –

2

Кажется, вас могут смутить между различными типами машинного обучения.

Набор данных, приведенный в вашем классе, является примером классификации supervised. То есть, учитывая некоторые данные и некоторые классы, изучите классификатор, который может прогнозировать классы по новым, невидимым данным. Классификаторы, которые можно применить к этой проблеме относятся

Вторая проблема, которую вы описываете, является примером unsupervised классификации проблемы , То есть, учитывая некоторые данные без меток, мы хотим найти автоматический способ разделения данных различных типов (ваши A и B) алгоритмически. Алгоритмы, которые решают эту проблему включают

Я хотел бы посмотреть на запуск факторного анализа или нормализации данных, а затем запустить K -средства или гауссовой смеси. Это должно обнаружить типы данных A и B, если они различимы.

Смежные вопросы