Я пытаюсь объединить два набора данных со строкой place
, которая похожа, но во многих случаях не совсем то же самое.Нечеткое совпадение строк и слияние
Например, в другом наборе данных могут быть такие записи, как Лондон, Великобритания и только Лондон. Я хотел бы иметь соответствующий балл рядом с каждой записью и объединять их по счету подобия (и сливаться, если он больше 0,80).
Есть ли способ объединить два набора данных A и B с переменными place
?
Первый набор данных А имеет четыре переменные: name, place, origin, ranking
Второй набор данных B имеет три переменные: ratings, place, destinations, trip time
Я хочу объединить набор данных A и B. набора данных
Окончательный объединенный набор данных должен иметь следующие переменные: name, place, origin, ranking, ratings, destinations, trip time
Я хочу объединиться на основе набора данных A (как левое соединение в SQL). Я хочу, чтобы все записи А с добавленными столбцами из В.
подобный вопрос был задан вопрос минут назад. Если это не поможет, разверните свой вопрос с примерами. http://stackoverflow.com/questions/30129903/how-can-i-fuzzy-match-corporations-names-when-using-two-separate-apis-datab –
Я расширил вопрос, чтобы быть более конкретным. – user3570187
[Как сделать отличный пример воспроизведения R?] (Http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example) – zx8754