Я следующий кадром данных:слов в предложениях и их ближайшие соседи в лексиконе
sent <- data.frame(words = c("just right size", "size love quality", "laptop worth price", "price amazing user",
"explanation complex what", "easy set", "product best buy", "buy priceless when"), user = c(1,2,3,4,5,6,7,8))
Направлено кадр данные привели к:
words user
just right size 1
size love quality 2
laptop worth price 3
price amazing user 4
explanation complex what 5
easy set 6
product best buy 7
buy priceless when 8
Мне нужно удалить слово в начале из следующего предложения который совпадает с словом в конце предыдущего сообщения.
Я имею в виду, например. у нас есть предложения «just right размер» и «размер love quality», поэтому мне нужно удалить слово размер на втором месте. Затем предложения «ноутбук стоит цена» и «цена замечательный пользователь», поэтому мне нужно удалить слово цена на четвертое место.
Может кто-нибудь мне помочь, я буду признателен за любую вашу помощь. Заранее большое спасибо.
Это работает только для первых двух предложений. Можно ли расширить свой подход для всех предложений в кадре данных? – martinkabe
@Martin Я думал, что ваш ожидаемый результат будет таким же, как я показал на выходе. Можете ли вы показать ожидаемый результат. Если в другом примере есть аномалия, пожалуйста, обновите его в своем сообщении – akrun
@Martin Возможно ли, что в вашей колонке есть пробелы с ведущими/отстающими? – akrun