Из заданного data.frame с текстовым столбцом мне нужно подмножество строки, которая содержит подстроку символов, ранее сохраненную в векторе (или во втором столбце data.frame).R - data.frame подмножество с поиском подстроки
Example data:
require(stringi) # Used for generate random string
set.seed(1)
df <- as.data.frame(cbind(seq(from = 1, to = 10, by = 1), stri_rand_strings(10, 5)))
df
V1 V2
1 1 GNZuC
2 2 twed3
3 3 CAgNl
4 4 UizNm
5 5 vDe7G
6 6 N0NrL
7 7 TbUBp
8 8 fn6iP
9 9 oemYW
10 10 m1Tjg
Если хранить искомые подстроки в векторе, как показало
tofind <- c("AgN", "bUB")
В результате мне нужно получить следующий data.frame
V1 V2
1 3 CAgNl
2 7 TbUBp
Спасибо за любую помощь
Он отлично работает и на реальном большом набор данные. Мой тупик решен. Одно расширение вопроса: возможно ли иметь эквивалентное решение, используя инструкцию подмножества? – Tiziano
Да, вот и все! см. обновление –
Хотя подробный поиск более прост в использовании синтаксиса подмножества. Я исправил свою ошибку для дальнейших читателей. Спасибо всем. – Tiziano