Так что у меня есть эти два РДА, которые выглядят следующим образом:Pyspark: Получить индексы РДА элементов из другого РДА
rdd1: [([1, 2], 0), ([2, 4], 1)]
rdd2: [([2, 4], 0), ([1, 2], 1)]
Что мне нужно, это список, который указует индексы rdd1 элементов в rdd2. так что это будет что-то вроде этого:
[1,0]
Я знаю, что я могу найти один конкретный индекс элемента, используя фильтр и лямбда-функции, но найти все это другая история. Наивный подход в моей голове использует цикл for, который, я уверен, не лучший способ справиться с этой проблемой. Любая помощь приветствуется.
Благодаря