Я пытаюсь импортировать определенный файл .CSV в мою базу данных с помощью PDI (чайник).Сравнение имен файлов в PDI
Обычно это было бы довольно просто, поскольку вы могли бы просто соединить шаг CSV file input
с шагом Table output
и быть хорошим. Однако проблема заключается в том, что я не знаю, какой файл я хочу импортировать заранее, как и перед выполнением задания/преобразования в PDI.
Это потому, что у меня есть много файлов в моей папке импорта, которые все имеют одинаковый формат относительно их файла: KeyDate_Filename_YYYYMMDD.CSV
Идеи состоит в том, чтобы иметь файл с новейшем ГГГГММДДОМ импортируемым для данного ключа даты.
Мой теоретический подход к реализации этого будет:
- сделать данную ключевую дату доступной в PDI в качестве параметра (уже сделано)
- Распознать имена всех файлов, сохраненных в папке импорта
- Фильтр сказал имена файлов для данного ключа даты
- Сравните ГГГГММДД оставшихся файлов и выберите новейший
- Использовать выбранное имя файла в качестве параметра в
CSV file input
стадии (уже сделано) - Импорт данных через
Table output
стадии (уже сделано)
К сожалению, я довольно новыми для PDI и действительно нет убедительная идея о том, как реализовать смелые детали, или если этот подход в целом даже жизнеспособен.
Может ли кто-нибудь подумать о том, как это сделать? Цените любую обратную связь
Редактировать: Забыл отметить, что я использую PDI 3.2.6.
В 4.x.x я мог бы просто использовать опред.польз.имя класса Java, чтобы получить это сделать:/