1
У меня есть ДФ:GSUB() весь столбец над другой колонкой
df <- data.frame(
x=c("ABC Inc", "DCV", "FGZ", "JH7 j11"),
y=c("ABC - fasjdlkjs", "DCV . (INC) .. kdhkfhksf", "FGZ/qiuwy72gs", "JH7 j11 dhd"),
target=c("fasjdlkjs", "inc kdhkfhksf", "qiuwy gs", "dhd")
)
Где x
является близким, но не точным подмножество y
Я хочу GSUB() все в x
к ""
(пробел) в y
, а также удаление номеров/знаков препинания.
Мой желаемый результат сохраняется в target
Я думал, что это сработало бы, но это не так:
df <- mutate(target = gsub(pattern=x, replacement="", y))
EDIT:
Сортировать по: Y - X = Target
Сладкие! ABC и INC все еще остаются. Я бы хотел, чтобы они исчезли. – emehex
О, я вижу, поэтому он должен удалить любые слова, которые находятся в 'x', т.е. не соответствует всей строке, но ее части? – jenesaisquoi
Это правильно! – emehex