2016-12-06 1 views
-1

У меня есть эта база данных от использования Emotiv Epoc волонтерах, поэтому мне нужно запустить некоторые алгоритмы классификации, чтобы проанализировать, есть ли разница между мужчинами и женщинами. Проблема здесь: мне нужно использовать такие алгоритмы, как kNN, SVM, panyzedSVM, дерево решений, Naive Bayes, adaboost и т. Д., Но для запуска этого в базе данных. Мне нужно меньше записей. базы данных, как это:Как я могу уменьшить количество записей в моей базе данных, чтобы использовать некоторые алгоритмы классификации, такие как SVM или kNN в R?

http://imageshack.com/a/img922/4035/gU165e.png

Таким образом, для каждого добровольца, у меня есть около 600 записей в тесте. И 50 добровольцев, 25/25 мужчин/женщин. Кто-нибудь знает, что я могу сделать, чтобы уменьшить количество записей или какие алгоритмы я могу использовать?

Просьба помочь мне.

+0

Перейти для запуска PCA first –

ответ

0

Вам следует попробовать использовать команду unique. Я отмечаю, что для каждой записи ваши данные различаются, что является фактором, который вы также должны учитывать. Тем не менее, вы можете сохранить одну запись для каждого человека таким образом:

install.packages("data.table") 
library(data.table) 

a <- c(rep("A", 3), rep("B", 3), rep("C",2)) 
b <- c(1,1,2,4,1,1,2,2) 
dt <-data.table(a,b) 

>dt 
     a b 
1: A 1 
2: A 1 
3: A 2 
4: B 4 
5: B 1 
6: B 1 
7: C 2 
8: C 2 

>unique(dt,by="a") 
     a b 
1: A 1 
2: B 4 
3: C 2 

Надеюсь, что ответит на то, что вы хотите!

Смежные вопросы