У меня есть большой файл с 7 столбцов, Я хотел бы сравнить 2 колонки, Col 1 и Col 7рассчитывать вхождения значения в колонке 1 для каждой строки в колонке 2, используя AWK
chr_locations(col 1) gene_name(col 7)
chr1:66997989-67000678 geneA
chr1:66997824-67000456 geneA
chr2:33544389-33548489 geneB
chr2:33546285-33547055 geneB
chr2:44567890-44568980 geneB
я бы нравится считать вхождения локализаций для данного гена:
chr1:66997989-67000678 geneA 2
chr1:66997824-67000456 geneA 2
chr2:33544389-33548489 geneB 3
chr2:33546285-33547055 geneB 3
chr2:44567890-44568980 geneB 3
Я уверен, что есть более простой способ сделать это в AWK, чем писать сценарий в Python, может любые из вас помочь? Благодарю.
* Я уверен, что есть более простой способ сделать это в awk, чем писать скрипт в python *. * Легче * означает, что у вас уже есть версия в Python, которая * не * легко ?. Можете ли вы показать это ?. Также проверьте эту страницу, которая поможет вам правильно отформатировать ваш вопрос: http://stackoverflow.com/editing-help – hek2mgl
Что такое вклад столбца 1 в подсчеты? – karakfa
Можете ли вы объединить 'cut' для столбцов 1 и 7,' sort' и 'uniq -c'? –