У меня есть два кадра данных:Количество матчей между двумя строками
df.1 <- data.frame(loc = c('A','B','C','C'), person = c(1,2,3,4), str = c("door/window/table", "window/table/toilet/vase ", "TV/remote/phone/window", "book/vase/car/chair"))
Таким образом,
loc person str
1 A 1 door/window/table
2 B 2 window/table/toilet/vase
3 C 3 TV/remote/phone/window
4 C 4 book/vase/car/chair
И,
df.2 <- data.frame(loc = c('A','B','C'), str = c("book/chair/chair", " table/remote/vase ", "window"))
, который дает,
loc str
1 A book/chair/car
2 B table/remote/vase
3 C window
Я хочу создать переменную df.1$percentage
, которая вычисляет проценты элементов в df.1$str
, которые находятся в df.2$str
редактировать по LOC, или:
loc person str percentage
1 A 1 door/window/table 0.00
2 B 2 window/table/toilet/vase 0.50
3 C 3 TV/remote/phone/window 0.25
4 C 4 book/vase/car/chair 0.00
(1
имеет 0/3, 2
имеет 2/4 матчей, 3
имеет 1/4, а 4
имеет 0/4)
Спасибо!
Соответствующие элементы должны иметь один и тот же локаль? – Edward
Прости, да. строки соответствия, используя 'loc'. Я отредактировал вопрос. – Lucarno