обработка данных с использованием r

У меня есть файл .ped, который содержит несколько столбцов, и я хочу извлечь из него информацию. Вот образец моих данных (нет заголовка):обработка данных с использованием r

Первый столбец указывает идентификатор семьи, второй идентификатор индивидуальный, третий пол индивидуума.

Я прочитал таблицу как dataframe

ped <- read.table("pedigree.ped", header=FALSE)

Как я могу вычислить число семей, существуют (одна семья может оказаться более чем один раз, и я хочу, чтобы рассматривать их как один)? У меня есть секс-столбец, где 1 обозначают мужчин и 2 женщин, как я могу получить распределение мужчин и женщин в наборе данных?

Я новичок в R, если вы можете дать код!

Спасибо в продвижении.

источник

2013-04-06 Hocine Ben

отправьте образец своих данных, пожалуйста. –

^^^ это - 'head (ped)' – Nishanth

, пожалуйста, дайте мне индексы –

Поскольку вы новичок в R, я бы предложил сначала изучить Excel. Операции, о которых вы просите, довольно просты и могут быть выполнены в Excel.

Если вы хотите использовать R затем посмотреть в data.frame индексации, Подменю и т.д.

Если вы знакомы с SQL, смотрите, чтобы sqldf package

Количество семей:

numFamilies <- length(unique(ped[,1]))

Количество самцов & самок:

numMales <- sum(ped[,3] == 1) 
numFemales <- sum(ped[,3] == 2)

источник

2013-04-06 01:49:18 Nishanth

Какая связь между SQL и R? !! –

Многие люди, знакомые с синтаксисом R, знакомы с интерфейсом sql. выбирать, считать, группировать и т. д. Вы можете запросить объект data.frame с помощью пакета sqldf. – Nishanth

@ e4e5f4: не обязательно. – Metrics

Попытайтесь использовать это для ознакомления с данными:

For family: 
table(ped[,1]) 

For sex: 
table(ped[,3])

источник

2013-04-06 02:14:45 Metrics

обработка данных с использованием r

ответ

Смежные вопросы