У меня есть корпус документов JSON, и я хочу конвертировать/хранить их в формате Паркет для эффективной обработки с использованием C++. У меня есть 2 вопроса относительно процесса:Преобразование документов JSON в паркет
Q1- Во всех подобных примерах и случаях тестов, которые я нашел в Интернете для преобразования данных в формат паркет (например, this), кажется, что схема должна быть определена перед время. Однако мои документы JSON не соответствуют единой/фиксированной схеме. Мне просто интересно, действительно ли определение схемы действительно является требованием или нет (как я полагаю, Parquet предназначен для поддержки неструктурированных данных с эффективным вложением и необязательными значениями).
Q2- Почти все доступные примеры используют библиотеки Java. Тем не менее, я ищу эффективный способ сделать такое преобразование в C++. Любой намек на это? (Я начал смотреть на Parquet-cpp repo и его тестовые примеры, но мне интересно, есть ли более краткий пример с доступными минимальными зависимостями).