У меня есть dataframe, как показано ниже:Функция для повторяющихся строк
> df
pat_id disease
[1,] "pat1" "dis1"
[2,] "pat1" "dis1"
[3,] "pat2" "dis0"
[4,] "pat2" "dis5"
[5,] "pat3" "dis2"
[6,] "pat3" "dis2"
Как я могу написать функцию, чтобы получить третью переменную, которая указывает на то же pat_id переменная заболевание представляет собой то же самое или нет, как показано ниже?
> df
pat_id disease var3
[1,] "pat1" "dis1" "1"
[2,] "pat1" "dis1" "1"
[3,] "pat2" "dis0" "0"
[4,] "pat2" "dis5" "0"
[5,] "pat3" "dis2" "1"
[6,] "pat3" "dis2" "1"
'as.integer (дублируется (dat) | duplicated (dat, fromLast = TRUE)) 'может работать, – user20650
У вас нет данных. Это была матрица. –