мне нужно, эффективно анализировать одну из моей колонки dataframe (URL-адрес строки) и вызвать функцию (strsplit), чтобы разобрать его, например:R применять функцию столбца данных кадра
url <- c("www.google.com/nir1/nir2/nir3/index.asp")
unlist(strsplit(url,"/"))
Мои данные рама: spark.data.url.clean выглядит следующим образом:
classes url
[107,662,685,508,111,654,509] drudgereport.com/level1/level2/level3
Это ДФ имеет 100k строк, и я не хочу, чтобы петля/перебрать его, разобрать каждый URL отдельно и записи результатов в соответствии с передаваемыми данными Рамка. Что мне нужно/хочу, чтобы создать новый 5 столбцов кадра данных:
df.result <- data.frame(fullurl = as.character(),baseurl=as.character(), firstlevel = as.character(), secondlevel=as.character(),thirdlevel=as.character(),classificaiton=as.character())
вызов одного из «применить» функции семьи над spark.data.url.clean$url
и записать результаты в новый кадр данных df.result
таким образом, что первый столбец (fullurl
) будет заполняться с соответствующим spark.data.url.clean$url
, то второй до 5-го столбцов будет заполняться с соответствующими результатами от применения
unlist(strsplit(url,"/"))
- принимать только первый, 2-й, 3-й и 4-й элементов из приведеннога вектор и положить его в первая, 2-й, 3-й и 4-й колонна в df.result
и, наконец, ставящие spark.data.url.clean$classes
в новых кадрах данных столбцов df.result$classificaiton
Извините за усложнение и дайте мне знать, если что-то нужно быть дополнительно очищено.
Это не дает ответа на вопрос. – Heroka