У меня есть текстовый файл, содержащий идентификаторы последовательности. Эти файлы Ids содержат несколько дубликатов идентификаторов. Несколько идентификаторов также присутствуют более двух раз в этом файле. Я хочу найти уникальные идентификаторы в одном файле и повторные идентификаторы в другом файле. Кроме того, мне также интересно найти число, сколько раз повторяющиеся идентификаторы, присутствующие в файле.Как получить уникальные идентификаторы из txt-файла?
Я нашел дублированную последовательность, используя следующую команду
$ cat id.txt | grep '^>' | sort | uniq -d > dupid.txt
Это дает мне дублированные последовательности в файле «dupid.txt». Но как мне получить те, которые присутствуют более 2 раз и сколько раз они присутствуют? Во-вторых, как найти уникальные последовательности?