Мне поручено написать программу, которая ловит плагиатов. Учитывая папку с файлами, как бы я прокручивал их по-файл, создавая список всех шестисловных фраз в каждом файле. Примером этого являетсяЧтение через папку с файлами?
Настало время для всех хороших людей прийти на помощь своей стране.
Содержит 6-словосочетаний: Сейчас настало время для всех, времени для все хорошего, времени для всех хороших людей, времени для всех хороших людей к, ... и так далее ,
ExampleFile=F.read('File')
index1=0
index2=5
List1=[]
while True:
index1+=1
index2+=1
List1+= Examplefile[index1:index2]
Является ли это до сих пор, чтобы создать списки из 6 словосочетаний. Как же я мог бы сделать это для каждого файла, а затем сравнить эти результаты, чтобы увидеть, есть ли в двух файлах более 200 одинаковых фраз? Я сделал очень мало, используя файлы на Python, настолько немые, насколько возможно. Благодаря!