Я работаю в SEO, и иногда мне приходится управлять списками доменов, которые необходимо учитывать для определенных действий в наших кампаниях. На моем iMac у меня есть 2 списка, один предоставлен для рассмотрения - unfiltered.txt
- и еще один, который перечислил домены, которые я уже проанализировал - used.txt
. Один предусмотрено рассмотрение, новый (unfiltered.txt
), выглядит следующим образом:Решение для Mac OS-терминала для удаления из строк текстового файла из другого текстового файла
site1.com
site2.com
domain3.net
british.co.uk
england.org.uk
auckland.co.nz
... etc
Список доменов, которые необходимо использовать в качестве фильтра, чтобы устранить (used.txt
) - выглядит следующим образом.
site4.org
site5.me
site6.co.nz
gland.org.uk
kland.co.nz
site7.de
site8.it
... etc
Есть ли способ, чтобы использовать мой X терминал OS, чтобы удалить из unfiltered.txt всех линий, найденных в used.txt? Найденное программное решение, которое частично решает проблему, и, кроме слов из used.txt, исключает также слова, содержащие эти меньшие слова. Это означает, что я получаю более широкий фильтр и устраняю также домены, которые мне по-прежнему нужны.
Например, если мой файл unfiltered.txt содержит домен с именем fogland.org.uk
, он будет автоматически удален, если в моем файле used.txt у меня есть домен с именем gland.org.uk
.
Файлы довольно большие (около 100 тыс. Строк). У меня довольно хорошая конфигурация: SSD, 7-й генератор 7-го поколения, 16-гигабайтная оперативная память, но маловероятно, чтобы она работала в течение нескольких часов только для этой операции.
... надеемся, что это имеет смысл.
ТИА
Дубликат [Удалить строки из файла, которые появляются в другом файле] (http://stackoverflow.com/questions/4366533/remove-lines-from-file-which-appear-in-another-file) – davidcondrey