2015-04-25 2 views
0

Я написал модуль, содержащий класс с методами, которые возвращают различную информацию о данной последовательности ДНК. Я хочу написать еще один модуль с классом, который может сравнивать информацию из двух последовательностей. Вот что у меня есть.Один объект в классе, перезаписывающий другой

import genomeAnalyzer as g 

class GenomePair: 

    def __init__(self, gene_1, gene_2): 
      self.gene_1 = g.Genome(gene_1) 
      self.gene_2 = g.Genome(gene_2) 

    def compareGC(self): 
      print(self.gene_1.gcComp()) 
      print(self.gene_2.gcComp()) 



GenomePair_obj = GenomePair("testTiny.fa", "haloVolc1_1-genes.fa") 
GenomePair_obj.compareGC() 

И вот фрагмент класса генома, который сам использует другой модуль.

import sequenceAnalysis as seq 

class Genome: 

    def __init__(self, file): 
     """ 
     Separates sequence data from header data in the given FASTA file, 
     creates a NucParams object and calls the codonComposition method 
     to populate the codon dictionary.  
     """ 
     self.file = file 
     self.fasta = seq.FastAreader(self.file) 
     sequence = "" 
     for pair in self.fasta.readFasta(): 
      DNA = pair[1] 
      sequence += DNA 
     self.sequence = sequence 
     self.DNA_obj = seq.NucParams(self.sequence) 
     seq.NucParams.codonComposition(self) #Necessary? 

    def gcComp(self): 
     sum = seq.NucParams.nucCount(self) 
     GC_count = 0 
     for nuc in ['G', 'C']: 
      GC_count += seq.NucParams.nuc_freq[nuc] 
     GC_comp = ((GC_count/sum) * 100) 
     return GC_comp 

И NucParams:

class NucParams: 

    rnaCodonTable = { 
    # RNA codon table 
    # U 
    'UUU': 'F', 'UCU': 'S', 'UAU': 'Y', 'UGU': 'C', # UxU 
    'UUC': 'F', 'UCC': 'S', 'UAC': 'Y', 'UGC': 'C', # UxC 
    'UUA': 'L', 'UCA': 'S', 'UAA': '-', 'UGA': '-', # UxA 
    'UUG': 'L', 'UCG': 'S', 'UAG': '-', 'UGG': 'W', # UxG 
    # C 
    'CUU': 'L', 'CCU': 'P', 'CAU': 'H', 'CGU': 'R', # CxU 
    'CUC': 'L', 'CCC': 'P', 'CAC': 'H', 'CGC': 'R', # CxC 
    'CUA': 'L', 'CCA': 'P', 'CAA': 'Q', 'CGA': 'R', # CxA 
    'CUG': 'L', 'CCG': 'P', 'CAG': 'Q', 'CGG': 'R', # CxG 
    # A 
    'AUU': 'I', 'ACU': 'T', 'AAU': 'N', 'AGU': 'S', # AxU 
    'AUC': 'I', 'ACC': 'T', 'AAC': 'N', 'AGC': 'S', # AxC 
    'AUA': 'I', 'ACA': 'T', 'AAA': 'K', 'AGA': 'R', # AxA 
    'AUG': 'M', 'ACG': 'T', 'AAG': 'K', 'AGG': 'R', # AxG 
    # G 
    'GUU': 'V', 'GCU': 'A', 'GAU': 'D', 'GGU': 'G', # GxU 
    'GUC': 'V', 'GCC': 'A', 'GAC': 'D', 'GGC': 'G', # GxC 
    'GUA': 'V', 'GCA': 'A', 'GAA': 'E', 'GGA': 'G', # GxA 
    'GUG': 'V', 'GCG': 'A', 'GAG': 'E', 'GGG': 'G' # GxG 
    } 
    dnaCodonTable = {key.replace('U','T'):value for key, value in rnaCodonTable.items()} 
    DNA_codon_freq = {} 
    RNA_codon_freq = {} 
    nuc_freq = {'A':0, 'T':0, 'G':0, 'C':0, 'U':0, 'N':0} 
    aa_dic = {} 
    is_DNA = True 

    def __init__ (self, sequence): 
     for i in NucParams.dnaCodonTable: 
      NucParams.DNA_codon_freq[i] = 0 
     for i in NucParams.rnaCodonTable: 
      NucParams.RNA_codon_freq[i] = 0 
     self.sequence = sequence 
     NucParams.addSequence(self,self.sequence) 

    def addSequence (self, thisSequence): 
     s = ''.join(thisSequence).split() 
     s = ''.join(s).upper() 
     clean_seq = "" 
     if 'U' in s: 
      NucParams.is_DNA = False 
     for nuc in s: 
      if nuc in ['A', 'T', 'G', 'C', 'U', 'N']: 
       clean_seq += nuc 
       NucParams.nuc_freq[nuc] += 1 
     self.nuc_string = clean_seq 
     start, stop = 0, 3 
     codon_count = len(self.nuc_string) // 3 
     for i in range(codon_count): 
      codon = self.nuc_string[start:stop] 
      if 'N' in codon: 
       pass 
      elif NucParams.is_DNA == True: 
       NucParams.DNA_codon_freq[codon] += 1 
      elif NucParams.is_DNA == False: 
       NucParams.RNA_codon_freq[codon] += 1 
      start += 3 
      stop += 3 

    def aaComposition(self): 
     if NucParams.is_DNA: 
      freq = NucParams.DNA_codon_freq 
      dic = NucParams.dnaCodonTable 
     else: 
      freq = NucParams.RNA_codon_freq 
      dic = NucParams.rnaCodonTable 
     for i in dic: 
      x = dic.get(i) 
      NucParams.aa_dic[x] = 0 
     for codon in freq: 
      NucParams.aa_dic[dic[codon]] += freq[codon] 
     return NucParams.aa_dic 

    def nucComposition(self): 
     return NucParams.nuc_freq 

    def codonComposition(self): #Must output as RNA codon freq regardless of input 
     if NucParams.is_DNA == False: 
      return NucParams.RNA_codon_freq 
     else: 
      NucParams.RNA_codon_freq = {key.replace('T','U'):value for key, value in NucParams.DNA_codon_freq.items()} 
      return NucParams.RNA_codon_freq 

    def nucCount(self): 
     sum = 0 
     for i in NucParams.nuc_freq: 
      sum += NucParams.nuc_freq[i] 
     return sum 

Метод gcComp() возвращает число от 0-100, представляющее процент Gs или Cs в последовательности.

Когда я прокомментирую строку self.gene_2 в __init__ и соответствующую строку печати, она печатает GC comp 50.0. Когда я делаю то же самое для self.gene_1, я получаю GC comp 49.3. Но когда оба объявлены, оба они держат значение 49.3.

Почему, когда я создаю второй объект, он перезаписывает первый? У них разные имена, не так ли?

+1

Как ваш класс «Геном» реализован? Похоже, что он может использовать переменную класса, а не переменную экземпляра где-то, но поскольку вы не показывали ее код, я не могу быть уверен. – Blckknght

+0

@Blckknght Выполнено. – Sam

+0

@Sam: Код из seq.NucParams также понадобится. Как инициализируется нуль_freq? – gus27

ответ

1

Существует несколько возможных проблем, связанных с объектно-ориентированным программированием и различием между переменными класса и объекта.

E.g. в классе seq.NucParams:

def nucComposition(self): 
    return NucParams.nuc_freq 

Это возвращение статический (так широкий класс, в вашем случае программа широкий) значение nuc_freq - не nuc_freq объекта (который self.nuc_freq).

Другой пример:

В Genome.__init__ вы назначаете self.DNA_obj экземпляр NucParams:

self.DNA_obj = seq.NucParams(self.sequence) 

Но вы не будете использовать его больше в остальной части кода. Кажется, вы используете seq.NucParams как класс со статическими функциями вместо объекта с методами.

Я предполагаю, что в gcComp() вы должны использовать

sum = self.DNA_obj.nucCount()  # instead of sum = seq.NucParams.nucCount(self) 

и

GC_count += self.DNA_obj.nuc_freq[nuc]  # instead of GC_count += seq.NucParams.nuc_freq[nuc] 

IMHO вы должны исправить все эти неправильные использований переменных класса от использования объекта (экземпляра) переменных.

+0

... и я полагаю, что 'seq.NucParams.codonComposition (self)' должен быть 'self.DNA_obj.codonComposition()' – gus27

+0

Я пробовал это, класс Геном по-прежнему работает по-прежнему, но проблема остается в GenomePair. – Sam

+0

Я обновил свой ответ. Основная проблема заключается в 'seq.NucParams' и, возможно, неправильном использовании переменных класса (например,' NucParams.nuc_freq') вместо объектных переменных (например, 'self.nuc_freq') – gus27

Смежные вопросы