2013-09-12 2 views
4

У меня есть документ txt, содержащий одно слово, сопровождаемое датой в одной строке и т. Д. В каждой строке. Как notepad ++ распознает одинаковые слова в разных строках и удаляет повторяющиеся строки?Notepad ++ удаление строк, содержащих повторяющиеся слова

+0

Дубликат [Удаление повторяющихся строк в Notepad ++] (http://stackoverflow.com/questions/ 3958350/remove-duplicate-rows-in-notepad) – florisla

ответ

2

Предполагая, что даты могут отличаться для одного и того же слова одного и того же слова, и вы хотите сохранить тот, который появляется первым в файле, тогда это должно работать (убедитесь, что ваш файл заканчивается новой строкой для этого):

  1. перейти к «заменить» диалоговое окно (вы можете сделать Ctrl + F и перейдите на вкладку заменить)
  2. в «режим поиска» в нижней части выберите «Регулярное выражение» (убедитесь, что " совпадение с новой строкой "не выбрано)
  3. В «Найти:» поле типа (\s*\w+)(.*\r\n)((.*\r\n)*)\1.*\r\n
  4. В «Заменить на:» тип поля \1\2\3
  5. Нажмите кнопку «Заменить» до тех пор, пока не останется больше вхождений («Заменить все», кажется, не работает для этого, возможно, существует лучшее регулярное выражение, для которого оно будет работать, но я его не нашел).

Я проверил это на файл:

testing330  05:09-24/08 
whatever  10:55-25/08 
testing  15:57-26/08 
testing667  19:22-30/08 
linux  00:29-31/08 
testing330  00:29-31/08 
windows  12:25-31/08 

и результат был:

testing330  05:09-24/08 
whatever  10:55-25/08 
testing  15:57-26/08 
testing667  19:22-30/08 
linux  00:29-31/08 
windows  12:25-31/08 
+0

Это именно то, что мне нужно ed, но форматирование немного отличается, как бы вы сделали это в этом примере: http://pastebin.com/ZbtGeaTX Примечание: тестирование330 является единственным дубликатом в разное время (сначала сохранить) – xcyteh

+0

Метод, который я опубликовал, должен также работайте над своим примером (при условии, что каждая из этих записей находится в отдельной строке). Он не заботится о формате даты. Однако, если вы запускаете это в системе * nix, его, вероятно, придется немного изменить (заменяя каждый '\ r \ n' в коде на просто' \ n', он должен это делать). – SamYonnou

+0

Редактирование: исправлено с учетом пробелов в начале каждой строки. также изменил его так, что он удалит всю повторяющуюся строку, а не только текст на ней (чтобы это правильно работало, убедитесь, что файл заканчивается в новой/пустой строке) – SamYonnou

1

Для меня лично, вот шаги, я следую. Предположим, что в столбце A имеется только 1 столбец данных.

  1. Импортируйте данные в Excel.
  2. Сортировка данных.
  3. Вставьте функцию для проверки дубликатов. Ячейка B2 будет: = IF (A2 = A1, "Duplicate", "")
  4. Выделить все столбцы B.
  5. Копия.
  6. Вставьте специальные и вставьте значения.
  7. Сортировка данных в соответствии со столбцом B.
  8. Удалить все те, которые отмечены как «Дубликат».
  9. Скопируйте данные обратно в Notepad ++

Я думал, что плагин, как это, но не могу найти его сейчас. Otherwise, this link may help you.

+0

Использование TestFX помогло много, хотя я мог бы использовать excel, скопировать все документы потребуется много времени. – xcyteh

7

Не прямой ответ на ваш вопрос, но я нашел эту статью на основе названия. Я хотел просто удалить повторяющиеся строки. Я нашел простой способ сделать это here

  1. Отметить весь текст (CTRL + A). Нажмите «TextFX» → «TextFX Tools» → «Проверить» + «Сортировка» выводит только строки UNIQUE (в столбце) (если они еще не были проверены).
  2. Нажмите TextFX → Нажмите TextFX Tools → Нажмите Сортировать строки без учета регистра (в колонке)
2

Вы можете использовать EditPlus на окнах или TextWrangler на Mac для сортировки и удалить дубликаты строк легко.

После Notepad++ 6.5.2 (бесплатно) вы можете сортировать строки или вы можете установить плагин «TextFX Characters» с помощью «Plugin Manager».

TextFX содержит множество функций для преобразования выделенного текста. Featuring: * Интерактивный Brace Matching * обращение Quote * Характер случай Чередование * Текст обернув * Колонка Модельный ряд * Заполните текст вниз * Вставить счетчик текста вниз * Текст перекодировки * Числовой преобразования * URI & HTML кодирование * HTML для преобразования текста * Добавить текст W3C * сортировка текста * Ascii Диаграмма * Ведущие пробельные ремонт * Autoclose HTML & брекет Домашняя страница: http://textfx.no-ip.com/textfx/

Смежные вопросы