У меня есть строки в двух наборах данных, и я хотел бы выполнить частичное совпадение. Вот код, который я написалчастичное согласование строк в разных двух наборах данных для получения соответствия с более высокой частотой
df1 <- data.frame(A=c(.87,.11,.44,.45), B=c("I have a beard", "I slept for two hours", "I have had two courses","this is not true"))
df2 <- data.frame(X=c(127,10,433,344,890,4),Y=c("have","beard","syllabus","true","three","maths"))
Я хочу сделать pmatch и я ожидаю выход следующего
A B X Y
.87 I have a beard 127 have
.11 I slept for two hours NA NA
.44 I have had two courses 127 have
.45 this is not true 344 true
Я хотел бы частичное совпадение с левым присоединиться на df1. Я хочу получить максимум из двух матчей (например, в «У меня есть борода», строка «имеет» имеет 127, а «борода» - 10, и я хочу получить более высокий результат. Любые предложения?
Awesome! Он работал как прелесть, хотя это заняло некоторое время :) – user3570187
@ user3570187 Не должно быть значения для строки 2 (890 - это 'Y == three', что не так) –
Да, вы правы. Я забыл также заменить значения X на NA. Исправит это как можно скорее. – AntoniosK