Привет У меня есть набор данные следующим образом, например:Представления данных по одному столбцу в питоне
sample pos mutation
2fec2 40 TC
1f3c 40 TC
19b0 40 TC
tld3 60 CG
Я хочу, чтобы иметь возможность найти питон путь к, например, найти все экземпляры, где 2fec2 и 1f3c имеют те же мутации и распечатать код. До сих пор я пробовал следующее, но он просто возвращает все. Я совершенно новичок в python и пытаюсь отучить себя от awk - пожалуйста, помогите!
from sys import argv
script, vcf_file = argv
import vcf
vcf_reader = vcf.Reader(open(vcf_file, 'r'))
for record.affected_start in vcf_reader: #.affect_start is this modules way of calling data from the parsed pos column from a particular type of bioinformatics file
if record.sample == 2fec2 and 1f3c != 19b0 !=t1d3: #ditto .sample
print record.affected_start
Почему вы используете 'pyvcf', чтобы прочитать этот входной файл (так как это не формат)? –
Что вы называете «кодом», который хотите напечатать? – bli
Есть ли связь между форматом, описанным в следующей ссылке, и набором данных из трех столбцов, который вы показываете? http://www.internationalgenome.org/wiki/Analysis/vcf4.0/ – bli