У меня есть два файла, один выглядит так,распечатка файла, если столбцы из двух файлов совпадают
chrom start end ref alt alt_freq_CR alt_freq_ID gene gene_type
chr10 28814618 28814618 T C 0 0.4167 AAA sense
chr10 32557818 32557818 C T 0 0.1579 BBB PC
chr10 119245101 119245101 T C 0 0.1667 ZZZ rega
chr10 119245101 119245101 T C 0 0.1667 CCC sense
файл 2
chrom start end ref alt alt_freq_CR alt_freq_ID gene gene_type
chr10 28814618 28814618 T C 0 0.4167 AAA sense
chr10 32557 32557 C T 0 0.1579 BBB PC
chr10 119245101 119245101 T C 0 0.1667 DDD rega
chr10 119245101 119245101 T C 0 0.1667 EEE sense
мне нужна выходной файл, если он удовлетворяет следующие условия, как, , если столбец (8-й столбец) гена из file_1 и гена (восьмой столбец) из file_2 имеют соответствие, то его следует распечатывать следующим образом,
chrom start end ref alt alt_freq_CR alt_freq_ID gene gene_type chrom start end ref alt alt_freq_CR alt_freq_ID
chr10 28814618 28814618 T C 0 0.4167 AAA sense chr10 28814618 28814618 T C 0 0.4167
chr10 32557818 32557818 C T 0 0.1579 BBB PC chr10 32557 32557 C T 0 0.1579
Я попытался с помощью AWK для этого следующим образом, но это не печатали все совпадающие строки в выходной ..
awk 'FNR==NR{a[$16]=$0;next}{if(b=a[$16]){print b}}' file_1 file_2
Было бы очень здорово, если есть решение в питон скрипт, Кроме того, два файла разного размера, промежутки числа строк различны.
вы можете прочитать главы в документах pandas о 'merge' и' join'. – cel