У меня есть документ txt, содержащий одно слово, сопровождаемое датой в одной строке и т. Д. В каждой строке. Как notepad ++ распознает одинаковые слова в разных строках и удаляет повторяющиеся строки?Notepad ++ удаление строк, содержащих повторяющиеся слова
ответ
Предполагая, что даты могут отличаться для одного и того же слова одного и того же слова, и вы хотите сохранить тот, который появляется первым в файле, тогда это должно работать (убедитесь, что ваш файл заканчивается новой строкой для этого):
- перейти к «заменить» диалоговое окно (вы можете сделать Ctrl + F и перейдите на вкладку заменить)
- в «режим поиска» в нижней части выберите «Регулярное выражение» (убедитесь, что " совпадение с новой строкой "не выбрано)
- В «Найти:» поле типа
(\s*\w+)(.*\r\n)((.*\r\n)*)\1.*\r\n
- В «Заменить на:» тип поля
\1\2\3
- Нажмите кнопку «Заменить» до тех пор, пока не останется больше вхождений («Заменить все», кажется, не работает для этого, возможно, существует лучшее регулярное выражение, для которого оно будет работать, но я его не нашел).
Я проверил это на файл:
testing330 05:09-24/08
whatever 10:55-25/08
testing 15:57-26/08
testing667 19:22-30/08
linux 00:29-31/08
testing330 00:29-31/08
windows 12:25-31/08
и результат был:
testing330 05:09-24/08
whatever 10:55-25/08
testing 15:57-26/08
testing667 19:22-30/08
linux 00:29-31/08
windows 12:25-31/08
Это именно то, что мне нужно ed, но форматирование немного отличается, как бы вы сделали это в этом примере: http://pastebin.com/ZbtGeaTX Примечание: тестирование330 является единственным дубликатом в разное время (сначала сохранить) – xcyteh
Метод, который я опубликовал, должен также работайте над своим примером (при условии, что каждая из этих записей находится в отдельной строке). Он не заботится о формате даты. Однако, если вы запускаете это в системе * nix, его, вероятно, придется немного изменить (заменяя каждый '\ r \ n' в коде на просто' \ n', он должен это делать). – SamYonnou
Редактирование: исправлено с учетом пробелов в начале каждой строки. также изменил его так, что он удалит всю повторяющуюся строку, а не только текст на ней (чтобы это правильно работало, убедитесь, что файл заканчивается в новой/пустой строке) – SamYonnou
Для меня лично, вот шаги, я следую. Предположим, что в столбце A имеется только 1 столбец данных.
- Импортируйте данные в Excel.
- Сортировка данных.
- Вставьте функцию для проверки дубликатов. Ячейка B2 будет: = IF (A2 = A1, "Duplicate", "")
- Выделить все столбцы B.
- Копия.
- Вставьте специальные и вставьте значения.
- Сортировка данных в соответствии со столбцом B.
- Удалить все те, которые отмечены как «Дубликат».
- Скопируйте данные обратно в Notepad ++
Я думал, что плагин, как это, но не могу найти его сейчас. Otherwise, this link may help you.
Использование TestFX помогло много, хотя я мог бы использовать excel, скопировать все документы потребуется много времени. – xcyteh
Не прямой ответ на ваш вопрос, но я нашел эту статью на основе названия. Я хотел просто удалить повторяющиеся строки. Я нашел простой способ сделать это here
- Отметить весь текст (CTRL + A). Нажмите «TextFX» → «TextFX Tools» → «Проверить» + «Сортировка» выводит только строки UNIQUE (в столбце) (если они еще не были проверены).
- Нажмите TextFX → Нажмите TextFX Tools → Нажмите Сортировать строки без учета регистра (в колонке)
Вы можете использовать EditPlus на окнах или TextWrangler на Mac для сортировки и удалить дубликаты строк легко.
После Notepad++ 6.5.2 (бесплатно) вы можете сортировать строки или вы можете установить плагин «TextFX Characters» с помощью «Plugin Manager».
TextFX содержит множество функций для преобразования выделенного текста. Featuring: * Интерактивный Brace Matching * обращение Quote * Характер случай Чередование * Текст обернув * Колонка Модельный ряд * Заполните текст вниз * Вставить счетчик текста вниз * Текст перекодировки * Числовой преобразования * URI & HTML кодирование * HTML для преобразования текста * Добавить текст W3C * сортировка текста * Ascii Диаграмма * Ведущие пробельные ремонт * Autoclose HTML & брекет Домашняя страница: http://textfx.no-ip.com/textfx/
- 1. Удаление строк, содержащих повторяющиеся строки
- 2. Массовое удаление строк, содержащих определенные слова?
- 3. Удаление повторяющихся строк из Notepad ++
- 4. Как удалить повторяющиеся СЛОВА в Notepad ++?
- 5. Удаление строк, содержащих не буквенные символы. [Notepad ++/Regex]
- 6. Удаление строк, содержащих ASCII
- 7. Удаление строк, содержащих нуль
- 8. Извлечение строк, содержащих определенные слова
- 9. Удаление строк, содержащих определенные слова с дополнительными условиями в R
- 10. удаление содержимого между строк, содержащих определенные слова - в текстовом документе
- 11. Удаление строк, содержащих специальные символы
- 12. Пакет - Удаление строк, содержащих трубу
- 13. Удаление строк, содержащих excel vba
- 14. Удаление пустых строк в Notepad ++
- 15. Удаление повторяющихся строк в Notepad ++
- 16. Удаление строк, содержащих значения в списке
- 17. Запрос для выбора строк, содержащих заглавные слова
- 18. Regex для соответствия строк, не содержащих слова
- 19. Удаление строк, содержащих определенные даты, в R
- 20. pandas - удаление строк, содержащих определенные значения
- 21. Удаление строк на основе не содержащих имена
- 22. Удаление строк, содержащих перечисленные числа, в excel
- 23. Удаление точек с начала строк на NotePad ++
- 24. Notepad ++ Blank Удаление линии
- 25. Удаление элементов массива, содержащих число
- 26. Удаление всех строк, содержащих только первые 10 строк таблицы
- 27. Удалить повторяющиеся повторяющиеся слова javascript
- 28. Как удалить повторяющиеся строки в Notepad ++/EditPad?
- 29. CR LF notepad ++ удаление
- 30. Удаление стоп-слова из списка строк
Дубликат [Удаление повторяющихся строк в Notepad ++] (http://stackoverflow.com/questions/ 3958350/remove-duplicate-rows-in-notepad) – florisla