Как упоминалось в приведенной ниже ссылке, Geospark берет данные в формате CSV или Tab с разделителями. Мы можем взять данные из HDFS, преобразовать их в CSV и передать в Geospark для обработки.Geospark: возможно ли вводить данные из HDFS
Можем ли мы напрямую использовать Geospark на HDFS и выполнять обработку?
https://github.com/DataSystemsLab/GeoSpark
GeoSpark поддерживает либо значений, разделенных запятыми (CSV) или Tab, разделенных значений (TSV) в качестве формата входного сигнала. Пользователям необходимо указывать только входной формат как Splitter и начальный столбец пространственной информации в одном кортеже как Offset при вызове Constructors.