2016-02-22 2 views
0

Я хочу использовать пакет adegenet для проведения анализа генетических данных. Для этого мне нужно преобразовать файл fasta в файл genid, который распознает adegenet.R 'adegenet' package: DNAbin2genind не форматирует данные правильно

Я попытался ввести данные двумя разными способами с теми же результатами.

>mydata.fasta <- fasta2DNAbin("~/Desktop/blattodeatest/Cryptocercuspunctulatus/COII.afa") 

> mydata.fasta 
22 DNA sequences in binary format stored in a matrix. 

All sequences of same length: 404 

Labels: AB425873_COII AB425877_COII AB425878_COII AB425876_COII AB425880_COII AB425884_COII ... 

Base composition: 
a  c  g  t 
0.404 0.181 0.085 0.329 

>mydata.dna <- read.dna("~/Desktop/blattodeatest/Cryptocercus punctulatus/COII.afa", format="fasta") 

> mydata.dna 
22 DNA sequences in binary format stored in a matrix. 

All sequences of same length: 404 

Labels: AB425873_COII AB425877_COII AB425878_COII AB425876_COII AB425880_COII AB425884_COII ... 

Base composition: 
a  c  g  t 
0.404 0.181 0.085 0.329 

Затем я попытался преобразовать данные, но получить странные результаты.

>mydata.genind <- DNAbin2genind(mydata.fasta) 
>mydata.genind 
/// GENIND OBJECT ///////// 

// 22 individuals; 91 loci; 189 alleles; size: 62.3 Kb 

// Basic content 
    @tab: 22 x 189 matrix of allele counts 
    @loc.n.all: number of alleles per locus (range: 2-3) 
    @loc.fac: locus factor for the 189 columns of @tab 
    @all.names: list of allele names for each locus 
    @ploidy: ploidy of each individual (range: 1-1) 
    @type: codom 
    @call: DNAbin2genind(x = mydata.dna) 

// Optional content 
    - empty - 

В моих данных есть только один локус 404bp, и похоже, что файл fasta читается правильно. Я не могу понять, почему R думает, что есть 91 локуса после того, как я использую DNAbin2genind?

ответ

0

Причина в том, что объект genind рассматривает каждое полиморфное положение в гене как локус. Получить позиции, которые являются поли. в исходном типе выравнивания:

as.vector([email protected],mode="numeric") 
Смежные вопросы