2016-04-18 3 views
0

Как упоминалось в приведенной ниже ссылке, Geospark берет данные в формате CSV или Tab с разделителями. Мы можем взять данные из HDFS, преобразовать их в CSV и передать в Geospark для обработки.Geospark: возможно ли вводить данные из HDFS

Можем ли мы напрямую использовать Geospark на HDFS и выполнять обработку?

https://github.com/DataSystemsLab/GeoSpark

GeoSpark поддерживает либо значений, разделенных запятыми (CSV) или Tab, разделенных значений (TSV) в качестве формата входного сигнала. Пользователям необходимо указывать только входной формат как Splitter и начальный столбец пространственной информации в одном кортеже как Offset при вызове Constructors.

ответ

0

Да. Вы можете использовать GeoSpark для этого. GeoSpark поддерживает те же источники данных, что и Apache Spark. С точки зрения формата, GeoSpark поддерживает CSV, TSV, WKT и GeoJSON.

Смежные вопросы