У меня есть набор данных около 1,85 ГБ, который содержит файлы h5, мне нужно обработать эти файлы с помощью hadoop, для этого мне может понадобиться преобразовать эти файлы в текст или csv , Есть ли способ, которым hadoop может читать h5-файлы? Или любой хороший онлайн-инструмент для конвертирования h5-файлов в CSV-файлы или текстовые файлы? Или может ли кто-нибудь дать ссылку, где я могу загрузить огромный набор данных, содержащий текстовые или CSV-файлы?конвертировать h5 файл в файл csv или текстовый файл для обработки данных
заранее спасибо
h5dump (http://www.hdfgroup.org/HDF5/doc /RM/Tools.html#Tools-Dump) сбрасывает файл HDF5 в ASCII или XML, но вывод по-прежнему будет иерархическим, а не табличным, как файл CSV. Да, есть некоторая работа по интеграции HDF5 и Hadoop, используйте свою любимую поисковую систему, чтобы ее найти. –
Вы пробовали R/MATLAB или C/C++ для чтения содержимого? R и MATLAB предлагает экспорт csv; с C/C++ вы должны использовать fprintf/cout. –