Мне нужно сканировать каталог с сотнями или ГБ данных, которые имеют структурированные части (которые я хочу отсканировать) и неструктурированные части (которые я не хочу сканировать).Критерии каталога комплекса Python os.walk
Чтение функции os.walk, я вижу, что я могу использовать набор критериев в наборе, чтобы исключать или включать определенные имена или шаблоны каталогов.
Для этого конкретного сканирования, мне нужно было бы добавить конкретные включения/исключения критериев на каждом уровне в каталоге, например:
В корневом каталоге, представьте себе есть два полезных каталогов, «Dir A» и «Dir B 'и непригодный каталог мусора «Корзина». В Dir A есть два полезных подкаталога «Subdir A1» и «Subdir A2» и не полезный каталог «SubdirA Trash», тогда в Dir B есть два полезных подкаталога Subdir B1 и Subdir B2 плюс не полезный «SubdirB Trash», подкаталог. Посмотрел бы что-то вроде этого:
мне нужно иметь определенный список критериев для каждого уровня, что-то вроде этого:
level1DirectoryCriteria = множество ("Dir A", "Dir B")
level2DirectoryCriteria = множество ("Subdir А1", "А2 Subdir", "Subdir В1", "Subdir В2")
Единственные способы, которые я могу сделать, это, очевидно, непитонические, используя сложный и длинный код с множеством переменных и высоким риском нестабильности. Есть ли у кого-нибудь идеи о том, как решить эту проблему? В случае успеха он может сохранить время работы кода несколько часов за раз.
Это выглядит promising- я пытаюсь его и вернусь к вам. – user3535074
Решение получилось из этого! – user3535074