Я хотел бы написать функцию, сравнить две строки в R. Более точно, если есть эти данные:Сравнивая две версии одной и той же строки
data <- list(
"First sentence.",
"Very first sentence.",
"Very first and only one sentences."
)
Я хотел бы выход быть:
[1] "Very" " and only one sentences"
Мой выход построен всей подстрокой, которая не включена в предыдущую. Например:
2nd vs 1st, удалите соответствующую строку - «первое предложение». - со второго, поэтому результат «Очень».
# "First sentence."
# "Very first sentence."
# match: ^^^^^^^^^^^^^^^
Теперь сравните третий против 2, удалить соответствующие строки - «очень первый» - с 3-го, так что результат «и только один предложения».
# "Very first sentence."
# "Very first and only one sentences."
# match: ^^^^^^^^^^
Затем сравните четвёртую против 3, и т.д. ...
Так на основе этого примера мой вывод должен быть:
c("Very", " and only one sentences")
# [1] "Very" " and only one sentences"
Большое спасибо, но это решение, если в тексте есть одно и то же слово (реальные данные намного дольше) –
Я тестировал его, и он не дает правильного вывода, если 'данные <- список ( « Первое предложение »., « Очень первое предложение. предложение. ", " Очень первое предложение и только одно предложение. " )' –
Отредактировано дальше, чтобы следовать вашей логике более подробно. – alistaire