Чтобы найти повторяющиеся спички `Uniq -d`

Мои данные как/TMP/1Чтобы найти повторяющиеся спички `Uniq -d`

я бегу, и я ничего не получаю

cat /tmp/1 | uniq -d

Это странно, так как uniq -d РЕКОМЕНДУЕМЫМ

-d  Only output lines that are repeated in the input.

Как вы можете использовать uniq -d?

источник

2009-07-25 Léo Léopold Hertz 준영

Спасибо за ваши ответы! –

Вам необходимо отсортировать данные, прежде чем использовать uniq. Он удаляет/обнаруживает дубликаты только на соседних строках.

источник

2009-07-25 11:33:18 dave

Или используйте awk-скрипт для правильной работы? –

Спасибо, что указали это! --- Он даже говорит в руководстве 'Утилита uniq читает указанный входной файл, сравнивающий смежные строки - -.' –

С моим GNU coreutils uniq в руководстве написано: Отбросить все, кроме одной из последовательных одинаковых строк от INPUT (или стандартного ввод), запись в OUTPUT (или стандартный вывод). –

Попробуйте это двойной проверки, он будет выводить любые строки, которые дублируются:

cat /tmp/1 | awk 'seen[$0]++ == 1'

О, это ваша проблема:

cat /tmp/1 | sort | uniq -d

Сортировать его перед запуском Uniq!

источник

2009-07-25 11:25:09

не нужно использовать кошку. – ghostdog74

Строки 2 и 7 файла примера Маси - то же самое. Но они не являются последовательными линиями, которые, по-видимому, являются сердцем недоразумений. – dave

ghostdog, ну, я использую кошку, потому что OP тоже. Да, я знаю, что вместо этого я мог бы использовать перенаправление оболочки или давать в командной строке arg awk или sort. dave, спасибо. Не видел этого! изм. –

awk '{_[$0]++}END{for(i in _)if(_[i]>1) print i}' /tmp/1

или просто

awk '_[$0]++ == 1' file

источник

2009-07-25 11:34:06 ghostdog74

awk '_ [$ 0] ++' работает только в том случае, если для каждой строки с дубликатами имеется не более одного дубликата. Если бы у вас было три строки, которые были бы одинаковыми, он дважды печатался. –

Чтобы найти повторяющиеся спички `Uniq -d`

ответ

Смежные вопросы