Вот мои данные:Получить слова и значения в скобках в Scala-Спарк
doc1: (Does,1) (just,-1) (what,0) (was,1) (needed,1) (to,0) (charge,1) (the,0) (Macbook,1)
doc2: (Pro,1) (G4,-1) (13inch,0) (laptop,1)
doc3: (Only,1) (beef,0) (was,1) (it,0) (no,-1) (longer,0) (lights,-1) (up,0) (the,-1)
etc...
и я хочу, чтобы извлечь слова и значения, а затем хранить их в двух отдельных матриц, матрица matrix_1 является (DocId слов) и matrix_2 (значения docID);
, Что ваш подход/программа, которую вы работали до сих пор ?? –
Все ли эти данные в 1 файле? или каждая строка в отдельном файле? – RaGe