2016-01-24 2 views
0

В Pyspark, когда я пытаюсь напечатать список, я получаю все элементы, напечатанные в одной и той же линии:pyspark печать один элемент в каждой строке

>>> wordslist = words.collect(); 
>>> wordslist 
[(u'crazy', 1), (u'fox', 1), (u'jumped', 1)] 

Есть ли способ, которым я мог бы получить выход распечатываются на каждую строку, например:

>>> wordslist 
[ 
(u'crazy', 1), 
(u'fox', 1), 
(u'jumped', 1) 
] 

ответ

0

Это базовый питон. Когда вы собираете результат из RDD. Вы получаете список, который вы можете перебирать и печатать каждый элемент в желаемом формате.

Я думаю, что вопрос о том, как печатать список, ответил столько раз в SO.

И here - один пример.

$> mylist = myrdd.collect() 
$> for elem in mylist: 
$>  print elem 

Вы также хотели бы проверить pyspark documentation.

0

То же можно достичь с помощью foreach в Scala

mylist.forach(println) 
Смежные вопросы