2015-10-30 2 views
2

Есть ли какая-либо конкретная причина для метода Spark DataFrame API для возврата java.util.List вместо списка Scala?collectAsList in Spark DataFrame

+0

Я не мог найти документацию по этому выбору, поэтому я думаю, что это зависит от вывода. Я бы предположил, что это потому, что 'java.util.List' является изменчивым, тогда как scala' List' не является (и, возможно, предпочтительный вариант здесь лучше для изменяемого списка). –

+0

Никакой конкретной причины! http://www.scala-lang.org/api/current/index.html#scala.collection.mutable.MutableList - изменяемый список scala – eliasah

ответ

2

Я считаю, что в основном это функция удобства для пользователей Java, а также делает вещи намного проще для API Python. Глядя на журналы git (а также аннотацию), он был введен в первоначальное слияние API DataFrame, поэтому он не обязательно добавлялся в ответ на конкретную потребность. Иногда некоторые API-интерфейсы возвращают типы Java, поскольку они легче взаимодействуют с Python (через py4j), но это не похоже на это (API-интерфейс python собирает, поворачивая DF в RDD и собирая на RDD).