Я ищу, чтобы создать новый столбец из пересекающихся слов из двух столбцов, содержащей строки:Создание нового столбца с пересекающимися словами из двух других столбцов в R
sometext1 <- c('this is a text entry','here is another text entry','something else')
sometext2 <- c('text entry','text entry','no match here')
texts <- data.frame(sometext1=sometext1, sometext2=sometext2,stringsAsFactors=F)
Это моя попытка, которая не дала любой матч:
texts$common <- paste(Reduce(intersect, list(strsplit(texts$sometext1,' '), strsplit(texts$sometext2,' '))), sep=" ", collapse=" ")
тексты $ общее должно выглядеть примерно так:
1 'text entry'
2 'text entry'
3 ''
Спасибо!
вы имеете в виду, чтобы найти самую длинную общую последовательность слов? –
Кстати, вы могли бы избежать необходимости конвертировать символы 'sometext1' и' sometext2' в символ, используя аргумент 'stringsAsFactors = F' в команде' data.frame'. –
Также вы проверили эту ссылку: http://stackoverflow.com/questions/16196327/find-common-substrings-between-two-character-variables? –