Я обработки данных с искрой и Scala, и сохранить его в json
Спарк 2.0.0 - JSON уродливы выход
df2.write.mode("overwrite").json("mydata")
Результат выглядит следующим образом:
{"GPS_LAT":xx.xxxxx,"GPS_LONG":xx.xxxxx,"count":10063}
{"GPS_LAT":xx.xxxxx,"GPS_LONG":xx.xxxxx,"count":3142}
{"GPS_LAT":xx.xxxxx,"GPS_LONG":xx.xxxxx,"count":7766}
Я использую данные создать визуализацию с помощью d3
, используя d3.json
:
d3.json("mydata.json", function(d){
console.log(d)
};
Моя проблема заключается в том, что d3.js
ожидает json
быть отформатирован следующим образом:
[{"GPS_LAT":xx.xxxxx,"GPS_LONG":xx.xxxxx,"count":10063},
{"GPS_LAT":xx.xxxxx,"GPS_LONG":xx.xxxxx,"count":3142},
{"GPS_LAT":xx.xxxxx,"GPS_LONG":xx.xxxxx,"count":7766}]
Кто не так? Spark или d3
? Что я могу сделать, чтобы облегчить эту ситуацию, не добавляя вручную [,]
?
Вот что я тоже подумал - Как может быть, что такая система, как Spark, производит сломанный выход ?! –
Я не могу сказать, как я уже говорил, я никогда не использовал Спарк ... давайте подождем, чтобы увидеть чье-то мнение по этому поводу. –
Потому что вывод не JSON, а [JSON Lines] (http://jsonlines.org/), и этот __ ожидаемый результат в Spark. –