2015-04-25 6 views
-2

Есть два текстовых файла: 1.txt и 2.txt. 1.txt содержит URL-адреса, разделенные разрывами строк, и 2.txt содержит слова, разделенные разрывами строк, по одному слову в строке. Я хочу удалить URL-адреса из 1.txt, содержащие слова из 2.txt. Каков наиболее удобный способ сделать это? Например:.txt удалить строки, содержащие

1.txt:

website1.com 
website2word1.com 
webword2site3.com 

2.txt:

word1 
word2 

После обработки 1.txt должен выглядеть следующим образом:

website1.com 

Th e файлов достаточно велики. Первый файл содержит миллион строк (после разделения, есть несколько файлов), а второй содержит 10 000 строк.

+2

И ваш вопрос ...? –

+1

Какой язык программирования должен использоваться для этого скрипта? – rorra

ответ

0

Вы можете просто написать программу java для чтения url из 1.txt и сопоставить ее с 2.txt. И напишите url в 3.txt, если это соответствует требованию.

+0

Разве это не должно быть наоборот? IE итерации через '2.txt' ищет совпадения в' 1.txt'? – Moob

Смежные вопросы