Мои данные после того, как много программной очистки выглядит так (показывает частичный набор данных здесь).Удалите последовательные пробелы в линиях RDD в Spark
ABCD A [email protected] 79
BGDA F [email protected] 89
Я хотел бы, чтобы преобразовать это в следующем дальнейшего Спарке операции Dataframe
ABCD,A,[email protected],79
BGDA,F,[email protected],89
val reg = """/\s{2,}/"""
val cleanedRDD2 = cleanedRDD1.filter(x=> !reg.pattern.matcher(x).matches())
Но это ничего не возвращает. Как найти и заменить пустые строки разделителем? Спасибо! rt
Удалить регулярное выражение разделителей: 'Вэл REG = "" "\ s {2}" ""', и вы не можете использовать '. matches() ', поскольку для этого требуется полное совпадение строк. Используйте 'find()'. –
Возможно, что вы хотите намного проще, например https://ideone.com/T8OSIC. –
Спасибо Wiktor. Это помогло! – user1384205