Я написал модуль, содержащий класс с методами, которые возвращают различную информацию о данной последовательности ДНК. Я хочу написать еще один модуль с классом, который может сравнивать информацию из двух последовательностей. Вот что у меня есть.Один объект в классе, перезаписывающий другой
import genomeAnalyzer as g
class GenomePair:
def __init__(self, gene_1, gene_2):
self.gene_1 = g.Genome(gene_1)
self.gene_2 = g.Genome(gene_2)
def compareGC(self):
print(self.gene_1.gcComp())
print(self.gene_2.gcComp())
GenomePair_obj = GenomePair("testTiny.fa", "haloVolc1_1-genes.fa")
GenomePair_obj.compareGC()
И вот фрагмент класса генома, который сам использует другой модуль.
import sequenceAnalysis as seq
class Genome:
def __init__(self, file):
"""
Separates sequence data from header data in the given FASTA file,
creates a NucParams object and calls the codonComposition method
to populate the codon dictionary.
"""
self.file = file
self.fasta = seq.FastAreader(self.file)
sequence = ""
for pair in self.fasta.readFasta():
DNA = pair[1]
sequence += DNA
self.sequence = sequence
self.DNA_obj = seq.NucParams(self.sequence)
seq.NucParams.codonComposition(self) #Necessary?
def gcComp(self):
sum = seq.NucParams.nucCount(self)
GC_count = 0
for nuc in ['G', 'C']:
GC_count += seq.NucParams.nuc_freq[nuc]
GC_comp = ((GC_count/sum) * 100)
return GC_comp
И NucParams:
class NucParams:
rnaCodonTable = {
# RNA codon table
# U
'UUU': 'F', 'UCU': 'S', 'UAU': 'Y', 'UGU': 'C', # UxU
'UUC': 'F', 'UCC': 'S', 'UAC': 'Y', 'UGC': 'C', # UxC
'UUA': 'L', 'UCA': 'S', 'UAA': '-', 'UGA': '-', # UxA
'UUG': 'L', 'UCG': 'S', 'UAG': '-', 'UGG': 'W', # UxG
# C
'CUU': 'L', 'CCU': 'P', 'CAU': 'H', 'CGU': 'R', # CxU
'CUC': 'L', 'CCC': 'P', 'CAC': 'H', 'CGC': 'R', # CxC
'CUA': 'L', 'CCA': 'P', 'CAA': 'Q', 'CGA': 'R', # CxA
'CUG': 'L', 'CCG': 'P', 'CAG': 'Q', 'CGG': 'R', # CxG
# A
'AUU': 'I', 'ACU': 'T', 'AAU': 'N', 'AGU': 'S', # AxU
'AUC': 'I', 'ACC': 'T', 'AAC': 'N', 'AGC': 'S', # AxC
'AUA': 'I', 'ACA': 'T', 'AAA': 'K', 'AGA': 'R', # AxA
'AUG': 'M', 'ACG': 'T', 'AAG': 'K', 'AGG': 'R', # AxG
# G
'GUU': 'V', 'GCU': 'A', 'GAU': 'D', 'GGU': 'G', # GxU
'GUC': 'V', 'GCC': 'A', 'GAC': 'D', 'GGC': 'G', # GxC
'GUA': 'V', 'GCA': 'A', 'GAA': 'E', 'GGA': 'G', # GxA
'GUG': 'V', 'GCG': 'A', 'GAG': 'E', 'GGG': 'G' # GxG
}
dnaCodonTable = {key.replace('U','T'):value for key, value in rnaCodonTable.items()}
DNA_codon_freq = {}
RNA_codon_freq = {}
nuc_freq = {'A':0, 'T':0, 'G':0, 'C':0, 'U':0, 'N':0}
aa_dic = {}
is_DNA = True
def __init__ (self, sequence):
for i in NucParams.dnaCodonTable:
NucParams.DNA_codon_freq[i] = 0
for i in NucParams.rnaCodonTable:
NucParams.RNA_codon_freq[i] = 0
self.sequence = sequence
NucParams.addSequence(self,self.sequence)
def addSequence (self, thisSequence):
s = ''.join(thisSequence).split()
s = ''.join(s).upper()
clean_seq = ""
if 'U' in s:
NucParams.is_DNA = False
for nuc in s:
if nuc in ['A', 'T', 'G', 'C', 'U', 'N']:
clean_seq += nuc
NucParams.nuc_freq[nuc] += 1
self.nuc_string = clean_seq
start, stop = 0, 3
codon_count = len(self.nuc_string) // 3
for i in range(codon_count):
codon = self.nuc_string[start:stop]
if 'N' in codon:
pass
elif NucParams.is_DNA == True:
NucParams.DNA_codon_freq[codon] += 1
elif NucParams.is_DNA == False:
NucParams.RNA_codon_freq[codon] += 1
start += 3
stop += 3
def aaComposition(self):
if NucParams.is_DNA:
freq = NucParams.DNA_codon_freq
dic = NucParams.dnaCodonTable
else:
freq = NucParams.RNA_codon_freq
dic = NucParams.rnaCodonTable
for i in dic:
x = dic.get(i)
NucParams.aa_dic[x] = 0
for codon in freq:
NucParams.aa_dic[dic[codon]] += freq[codon]
return NucParams.aa_dic
def nucComposition(self):
return NucParams.nuc_freq
def codonComposition(self): #Must output as RNA codon freq regardless of input
if NucParams.is_DNA == False:
return NucParams.RNA_codon_freq
else:
NucParams.RNA_codon_freq = {key.replace('T','U'):value for key, value in NucParams.DNA_codon_freq.items()}
return NucParams.RNA_codon_freq
def nucCount(self):
sum = 0
for i in NucParams.nuc_freq:
sum += NucParams.nuc_freq[i]
return sum
Метод gcComp()
возвращает число от 0-100, представляющее процент Gs или Cs в последовательности.
Когда я прокомментирую строку self.gene_2
в __init__
и соответствующую строку печати, она печатает GC comp 50.0. Когда я делаю то же самое для self.gene_1
, я получаю GC comp 49.3. Но когда оба объявлены, оба они держат значение 49.3.
Почему, когда я создаю второй объект, он перезаписывает первый? У них разные имена, не так ли?
Как ваш класс «Геном» реализован? Похоже, что он может использовать переменную класса, а не переменную экземпляра где-то, но поскольку вы не показывали ее код, я не могу быть уверен. – Blckknght
@Blckknght Выполнено. – Sam
@Sam: Код из seq.NucParams также понадобится. Как инициализируется нуль_freq? – gus27