У меня есть куча csv-файлов, поступающих в виде ежедневного фида из какой-либо другой системы.удаление заголовков и пустых строк из файла csv
Мне нужно удалить заголовок и некоторые необязательно представить пустые строки из файлов, прежде чем загружать их на HDFS и создавать поверх него внешнюю таблицу.
В настоящее время у меня есть два процесса шага, который работает, чтобы удалить заголовок и пустое пространство, прежде чем положить файл на HDFS
//remove blank lines
sed -i '/^\s*$/d' file_20160802.csv
//remove header
sed -i 1d file_20160802.csv
//put file on HDFS
hdfs dfs -put file_20160802.csv /raw/abc/20160802/
Есть ли способ, я могу объединить два шага без создания каких-либо временных файлов?
Thanks heaps @sat !! –