У меня есть два кадра данных, которые имеют список как столбец. Оба блока данных идентичны, за исключением того факта, что порядок списка отличается в кадрах данных.
например. Схема: (текст идентификатор, название списка '<' текст>)
df1: (5, WrappedArray (азбука, PQR, хуг))
df2: (5, WrappedArray (азбука, хуг, PQR))
Когда я use intersect я не получаю эту запись в результатах. Как я могу получить пересечение таких записей?Перекрестные данные, которые имеют столбец списка
0
A
ответ
0
Я думаю, вы правы, что самым простым способом было бы отсортировать столбец списка.
val sortListFunc = udf((inputList: WrappedArray[String]) => {
inputList.sorted
})
val df1Sorted = df1
.withColumn("name_sorted",sortListFunc(col("name"))
.select($"id","name_sorted".as("name"))
val df2Sorted = df2
.withColumn("name_sorted",sortListFunc(col("name"))
.select($"id","name_sorted".as("name"))
Тогда вы должны быть в состоянии присоединиться или пересечься.
Смежные вопросы
- 1. MySql удалить строки, которые имеют столбец дубликата
- 2. Слияние ячеек, которые имеют одинаковые данные
- 3. Перекрестные корреляционные данные, содержащие «всплески»
- 4. Список групп, которые имеют данные из sql
- 5. выпадающего списка вместо ввода, которые имеют дату
- 6. Как отделить элементы списка, которые имеют класс?
- 7. Перекрестные данные Java и Asp.NET
- 8. MYSQL: получить данные, которые имеют аналогичные колонки
- 9. Выберите данные, которые имеют те же буквы
- 10. Как переименовать столбец которые имеют такое же имя с другим
- 11. SQL Выберите самые новые записи, которые имеют отчетливый столбец Имя
- 12. Проверьте все таблицы, которые имеют столбец с именем
- 13. Выберите этот столбец, которые не имеют определенную строку
- 14. PHP, MySQL - Выбор строки, которые имеют столбец с несколькими значениями
- 15. выбрать столбец с наибольшим идентификатором, которые имеют общие поля
- 16. Как присоединиться к двум данным, которые имеют общий столбец?
- 17. Слияние двух наборов данных, которые имеют 1 столбец, всего
- 18. Получить столбец, которые имеют максимальное значение суммы из матрицы
- 19. Dc.js lineChart не отображает перекрестные данные
- 20. Перекрестные ссылки в Python
- 21. Лазурное хранилище - перекрестные перекрестные обновления
- 22. Excel Формулы Потянуть все товары из списка, которые имеют значение
- 23. получать данные из разных таблиц, которые имеют только один общий столбец в SQL сервере
- 24. Сделать одинаковый столбец в двух таблицах всегда имеют одинаковые данные?
- 25. Отображает строки, которые имеют данные в них MySQL
- 26. MYSQL: сортировка по 2 столбцам, которые имеют схожие данные
- 27. Поиск списка всех таблиц, которые используют общий столбец
- 28. перекрестные ссылки в таблицах
- 29. Присоединение к классам NHibernate, которые имеют общий столбец, но не имеют внешнего ключа
- 30. Получите перекрестные данные нескольких таблиц в MySQL
В качестве альтернативы существует ли способ сортировки списка в кадре данных? –