У меня есть файл с разделителями табуляции с некоторыми дублируемыми строками. Меня интересует поиск строк с дубликатами во втором поле (позиция), а затем сохранение только строки с наивысшим значением в третьем поле (качество). Например, если файл выглядит, как показано ниже:Bash сортировать на основе одного поля и сравнивать на основе другого поля
chrom 1677 800
chrom 1677 850
chrom 1777 900
chrom 1799 900
Я заинтересован в сохранении только одну строку для каждой позиции, которая представляет собой самое высокое качество:
chrom 1677 850
chrom 1777 900
chrom 1799 900
я могу найти дублированные позиции с : awk 'seen [$ 2] ++' file.txt
Но я не уверен, как сравнивать дублированные строки со вторым полем на основе значения в третьем поле. Любая помощь будет принята с благодарностью!
Спасибо!
Вы, вероятно, следует [форматировать данных] (http://stackoverflow.com/editing-help#syntax-highlighting) в ваш вопрос для ясности. – lxe