0
Учитывая TSV-файл, возьмите первые две колонки в каждой строке и возвращает следующее: Array [Карта [column_one: String, column_two: String]]Scala: Учитывая TSV-файл, возьмите первые две колонки в каждой строке и верните следующее: Array [Map [column_one: String, column_two: String]]
Пример файла:
RowOneColumnOne RowOneColumnTwo RowOneColumnThree
RowTwoColumnOne RowTwoColumnTwo RowTwoColumnThree
Результат:
[
RowOneColumnOne: RowOneColumnTwo,
RowTwoColumnTwo: RowTwoColumnTwo
]
Пробовал это:
var keyword = sc.textFile("hdfs://nameservice/some_tsv_file.txt")
val keywords = keyword.map(x => x.split("\t").take(2).toList).collect().distinct
который возвратил массив [List [String]]:
[
[RowOneColumnOne, RowOneColumnTwo],
[RowTwoColumnTwo, RowTwoColumnTwo]
]
Просто не знаю, как преобразовать список [String] к карте.