После выполнения некоторых операций я получаю list
из set
следующего образом:питона 2.7: создание словаря из списка наборов
from pyspark.mllib.fpm import FPGrowth
FreqItemset(items=[u'A_String_0'], freq=303)
FreqItemset(items=[u'A_String_0', u'Another_String_1'], freq=302)
FreqItemset(items=[u'B_String_1', u'A_String_0', u'A_OtherString_1'], freq=301)
Я хотел бы создать из этого списка:
РД
словарь, например:
key: A_String_0 value: 303 key: A_String_0,Another_String_1 value: 302 key: B_String_1,A_String_0,A_OtherString_1 value: 301
Я хотел бы продолжить расчеты для получения доверия и Lift
Я попытался выполнить for
петли, чтобы каждый элемент из списка.
Вопрос в том, есть ли другой, лучший способ создать rdd и/или списки здесь?
Заранее спасибо.
a) Почему вы собираете в первую очередь, если вам нужен RDD. B) Каким должен быть класс ключей в словаре? – zero323
Вы уверены, что словарь вписывается в ваш главный узел? –
отличный совет о collect(), я забыл об этом. Не уверен Что я понимаю второй комментарий – Toren