1
Я создаю RDD из текстового файла. Некоторые строки не соответствуют формату, который я ожидаю, и в этом случае я использую маркер -1.Удалить элементы из Spark RDD
def myParser(line):
try:
# do something
except:
return (-1, -1), -1
lines = sc.textFile('path_to_file')
pairs = lines.map(myParser)
можно ли удалить строки с -1
маркером? Если нет, то каким будет обходной путь?
просто использовать 'фильтр' ... нет? – Markon
В Java я использую фильтр: .filter (new Function() {public Boolean call (CassandraRow row) throws Exception {return row.getString ("value"). Equals (whatIWant); } }). –
Fundhor
Что будет аргументом лямбда-функции. ключ, значение или оба? – Bob