У меня есть файл .ped, который содержит несколько столбцов, и я хочу извлечь из него информацию. Вот образец моих данных (нет заголовка):обработка данных с использованием r
1 1 1
1 2 1
2 3 2
3 4 1
3 5 2
...
Первый столбец указывает идентификатор семьи, второй идентификатор индивидуальный, третий пол индивидуума.
Я прочитал таблицу как dataframe
ped <- read.table("pedigree.ped", header=FALSE)
Как я могу вычислить число семей, существуют (одна семья может оказаться более чем один раз, и я хочу, чтобы рассматривать их как один)? У меня есть секс-столбец, где 1 обозначают мужчин и 2 женщин, как я могу получить распределение мужчин и женщин в наборе данных?
Я новичок в R, если вы можете дать код!
Спасибо в продвижении.
отправьте образец своих данных, пожалуйста. –
^^^ это - 'head (ped)' – Nishanth
, пожалуйста, дайте мне индексы –