У меня есть набор инструкцийПоиск в строке из списка ключевых слов и тегов ключевых слов, которые происходят
statement <- as.matrix(c("the cat sat on the mat",
"the dog ran up the hill",
"the dog ran up the hill to the mat"))
и список ключевых слов
keywords <- as.matrix(c("cat", "mat", "dog", "hill"))
Я хочу искать внутри заявления из моего списка ключевых слов и теги, которые имеют ключевые слова, т.е. имеют результат
statement keywords
the cat sat on the mat cat, mat
the dog ran up the hill dog, hill
the dog ran up the hill to the mat dog, hill, mat
Я думаю, один способ, которым я могу это сделать, это использовать Grep таким образом, как
statement[grep("cat", statement$V1, ignore.case = TRUE), "keywords"] <- "cat"
statement[grep("mat", statement$V1, ignore.case = TRUE), "keywords"] <- "mat"
... и так далее, но, во-первых, это не даст тег для меня все ключевые слова, которые происходят. Во-вторых, если я пытаюсь найти способ сделать это, когда у меня есть большой список разрешений, скажем 1000 ключевых слов и 500 заявлений, это будет просто громоздким.
Как бы вы предложили об этом? Есть ли способ использования grep или есть ли какие-либо пакеты, которые могут обрабатывать текст и возвращать ключевые слова из предопределенного списка?
Спасибо!
Нужно ли им быть объектами матрицы? Или достаточно векторов? – Benjamin
@benjamin векторов было бы достаточно в этом случае –
@ DarshanBaral спасибо! Это действительно полезно –