Мой нынешний запрос на Apache Drill выглядит следующим образом -Apache Drill месиво с результатами
select
CAST(columns[0] AS Integer) as ID,
to_timestamp(SUBSTR(columns[10],1,14),'YYYYMMddHHmmss') as RecordDt
from dfs.`/data/100Krows/`
То, что я хотел бы сделать, это получить метаданные ModificationTime для каждого из CSV-файлов в моей папке в виде колонка что-то вроде этого -
select
CAST(columns[0] AS Integer) as ID,
to_timestamp(SUBSTR(columns[10],1,14),'YYYYMMddHHmmss') as RecordDt,
modificationTime as versionStartTime
from dfs.`/data/100Krows/`
ModificationTime метаданные может быть найден, когда я бегом следующего
SHOW FILES in dfs.data
Есть ли способ достичь этого в его текущей версии 1.1 или 1.0?
UPDATE 1
То, что я действительно искал это файл метаданных, включенных в результирующий набор оператора выбора в отношении отдельных файлов
если моя структура каталогов выглядит следующим образом -
dir0
dir1
samefilename.csv -- Modified Date - 10/01/2013
*******DATA******
Col0,Col1,Col2
Val1-2013,Val2-2013,Val3-2014
*******DATA******
dir2
samefilename.csv -- Modified Date - 10/01/2014
*******DATA******
Col0,Col1,Col2
Val1-2014,Val2-2014,Val3-2014
*******DATA******
Тип запроса Я хочу написать -
select
name as filename,
modificationTime as versionStartTime,
Col0,
Col2,
Col3
from dfs.`/dir0/`
Ожидаемый результат -
Columns[0] Columns[1] Columns[2] .....
samefileName.csv 10/01/2013 Val1-2013 .....
samefileName.csv 10/01/2014 Val1-2014 .....
См. Ответ ниже. – Edmon
См. Вопрос https://issues.apache.org/jira/browse/DRILL-3698 – Edmon