У меня есть текстовый файл размером 2,5 ГБ, который содержит хеш-значения некоторых стандартных известных файлов. Моя задача - найти хэш всех файлов в моей файловой системе и сравнить их с хэшами, хранящимися в текстовом файле. Если совпадение найдено, мне нужно напечатать Known на экране, и если совпадение не найдено, мне нужно распечатать неизвестное на экране.Выполнять поиск по очень большому файлу программно в Python
Таким образом, подход к задаче довольно прост, но основная проблема заключается в том, что файлы, участвующие в процессе, очень велики.
Может кто-нибудь предложить, как выполнить эту задачу оптимизированным образом.
Должен ли я импортировать текстовый файл, содержащий хеши, в базу данных. Если да, то, пожалуйста, предоставьте ссылку, которая могла бы помочь мне ее выполнить.
Во-вторых, какой алгоритм я могу использовать для поиска, чтобы ускорить процесс?
Предпочитаемый язык - Python.