Есть ли способ указать точность чисел с плавающей запятой в искре, желательно непосредственно перед записью RDD в файл, чтобы при вычислении точность не терялась?Как определить точность с плавающей запятой в искры apache?
Минимальный рабочий пример,
sqlCtxt = HiveContext(sc)
fulldata = sqlCtxt.jsonFile(DATA_FILE)
fulldata.registerTempTable("fulldata")
newcpulists = sqlCtxt.sql('SELECT xxx FROM fulldata')
def reduceSumPerc(x,y):
#some reducefunction
def mapfunc(x):
#some map function
reducedresult = newcpulists.map(mapfunc).reduceByKey(reduceSumPerc)
# I want to reduce the precision just at this line, before writing to file.
reducedresult.coalesce(1, True).saveAsTextFile(RESULT_PATH)
Хорошо. Спасибо за ответ. Итак, есть ли какие-либо предложения о том, как это сделать? Можно ли использовать функцию python? –
Просто создайте выходную строку, как в предоставленном фрагменте. Параметры форматирования на Python должны быть более чем достаточно. – zero323