Я хочу использовать пакет adegenet
для проведения анализа генетических данных. Для этого мне нужно преобразовать файл fasta в файл genid, который распознает adegenet.R 'adegenet' package: DNAbin2genind не форматирует данные правильно
Я попытался ввести данные двумя разными способами с теми же результатами.
>mydata.fasta <- fasta2DNAbin("~/Desktop/blattodeatest/Cryptocercuspunctulatus/COII.afa")
> mydata.fasta
22 DNA sequences in binary format stored in a matrix.
All sequences of same length: 404
Labels: AB425873_COII AB425877_COII AB425878_COII AB425876_COII AB425880_COII AB425884_COII ...
Base composition:
a c g t
0.404 0.181 0.085 0.329
>mydata.dna <- read.dna("~/Desktop/blattodeatest/Cryptocercus punctulatus/COII.afa", format="fasta")
> mydata.dna
22 DNA sequences in binary format stored in a matrix.
All sequences of same length: 404
Labels: AB425873_COII AB425877_COII AB425878_COII AB425876_COII AB425880_COII AB425884_COII ...
Base composition:
a c g t
0.404 0.181 0.085 0.329
Затем я попытался преобразовать данные, но получить странные результаты.
>mydata.genind <- DNAbin2genind(mydata.fasta)
>mydata.genind
/// GENIND OBJECT /////////
// 22 individuals; 91 loci; 189 alleles; size: 62.3 Kb
// Basic content
@tab: 22 x 189 matrix of allele counts
@loc.n.all: number of alleles per locus (range: 2-3)
@loc.fac: locus factor for the 189 columns of @tab
@all.names: list of allele names for each locus
@ploidy: ploidy of each individual (range: 1-1)
@type: codom
@call: DNAbin2genind(x = mydata.dna)
// Optional content
- empty -
В моих данных есть только один локус 404bp, и похоже, что файл fasta читается правильно. Я не могу понять, почему R думает, что есть 91 локуса после того, как я использую DNAbin2genind?