Я пытаюсь найти способ разобрать несколько сотен файлов XLS; они содержат ежемесячные отчеты и хранятся в подкаталогах. В некоторых случаях есть несколько отчетов за месяц из-за ошибок в исходном файле XLS, которые были впоследствии исправлены. Я работаю в среде Windows. Мне нужно импортировать эти файлы в SAS для проведения анализа; Я не могу использовать какой-либо другой инструмент, кроме SAS и основной оболочки Windows (возможно, powershell).Список только последних файлов за каждый месяц в Windows
Имя файла содержит информацию о дате его создания, чтобы я мог идентифицировать повторные прогоны только из имен. Пример содержания каталога будет как:
rep1_02012016.xls
rep1_02112016.xls #this would be a rerun on feb 11 if feb 1's report contains an error
rep1_03012016.xls
rep1_04012016.xls
Моя идея заключается в том, чтобы перенаправить вывод команды оболочки для SAS, так что я знаю, какие файлы для чтения. Я не могу найти способ получить один файл за каждый месяц, фильтруя все, кроме самого последнего за каждый месяц. Поэтому я бы получил один для февраля, один для Мар, один для апреля и так далее. Любой указатель приветствуется.
В вашем вопросе не хватает нескольких деталей. Являются ли файлы сгруппированы в подкаталоги в год? Вам нужны результаты по годам или все файлы в том же отчете? Является ли формат имени _always_ XXXX_MMDDYYYY.xls или префикс может иметь разную длину? Префикс _always_ ограничен символом подчеркивания? Если вы не публикуете точные вопросы, вы можете не получить точные ответы ... – Aacini
...и ваш комментарий в этом примере неверен: «это будет повторение на feb 11, если отчет feb 1 содержит ошибку», но есть _not_ отчет о feb 1, только на feb 2's. ** ': /' ** – Aacini
@aacini: я переустановил то, что, на мой взгляд, является опечаткой - первое имя файла должно включать '02012016' не' 02021916' – Magoo