У меня есть следующие данные:Finding частота пар в наборе данных - R
Name Event
John EventA
Anna EventA
Dave EventA
Stew EventB
John EventB
Anna EventB
John EventC
Stew EventC
Dave EventC
Я хочу, чтобы выяснить, кто те же события больше всего. Так, например, в приведенном выше примере я хочу, чтобы он вернул, что верхние 3 наиболее похожие пары: John & Anna, John & Dave, John & Stew.
Я предполагаю, что я должен был бы сделать матрицу частот, как один ниже
Name John Anna Dave Stew
John 0 2 2 2
Anna 2 0 1 1
Dave 2 1 0 1
Stew 2 1 1 0
А потом превратить его в нечто вроде этого:
Pair Frequency
John Anna 2
John Dave 2
John Stew 2
Anna Dave 1
Anna Stew 1
Dave Stew 1
Но я понятия не имею, как идти об этом.
Я работаю с R, поэтому, если кто-нибудь знает способ сделать это, это будет огромной помощью!
В первой таблице, почему запись John-John 0. Почему это не 3? – G5W
Меня интересует только частота других пар. Так что, в то время как Джону - Джону было бы 3, я не хочу этого в моем списке пар. – Mark