С терминала unix мы можем использовать diff file1 file2
, чтобы найти разницу между двумя файлами. Есть ли аналогичная команда, чтобы показать сходство в двух файлах? (Много труб допускаются при необходимостиКак найти повторяющиеся строки в двух разных файлах? Unix
Каждого файл содержит строку с струнным предложением, они сортируются и повторяющиеся строки удалены с sort file1 | uniq
file1
:.. http://pastebin.com/taRcegVn
file2
: http://pastebin.com/2fXeMrHQ
И на выходе должны выводиться строки, которые отображаются в обоих файлах.
output
: http://pastebin.com/FnjXFshs
Я могу использовать Python, чтобы сделать это как таковой, но я думаю, что это слишком много, чтобы положить в терминал:
x = set([i.strip() for i in open('wn-rb.dic')])
y = set([i.strip() for i in open('wn-s.dic')])
z = x.intersection(y)
outfile = open('reverse-diff.out')
for i in z:
print>>outfile, i
Что ваши файлы выглядят как? – paulmelnikow
Возможный дубликат [как показать общие строки (reverse diff)?] (Http://stackoverflow.com/questions/746458/how-to-show-lines-in-common-reverse-diff) – tjameson
Большинство раз строка предложений человеческого языка. Иногда коллизируется с дополнительной информацией. – alvas