У меня есть набор данных (DAT), который выглядит следующим образом:данных реструктуризации с использованием R
Person IPaddress
36598035 222.999.22.99
36598035 222.999.22.99
36598035 222.999.22.99
36598035 222.999.22.99
36598035 222.999.22.99
36598035 444.666.44.66
37811171 111.88.111.88
37811171 111.88.111.88
37811171 111.88.111.88
37811171 111.88.111.88
37811171 111.88.111.88
Это отражает случаи, что люди зашли на веб-сайт в течение определенного периода времени. Мне нужны данные, чтобы выглядеть следующим образом:.
Person IPaddress Number of Logins
36598035 222.999.22.99 6
37811171 111.88.111.88 5
Таким образом, вместо нескольких записей для одного человека, есть только одна строки на одного человека, с подсчетом, сколько раз они вошли в
Кроме того, вы увидите в моем примере, что человек 36598035 вошел в систему под более чем 1 IP-адресом. Когда это произойдет, я хочу, чтобы IP-адрес в конечном наборе данных отражал IP-адрес режима, другими словами, IP-адрес, который пользователь регистрировал чаще всего.
@ waxattax: количество входов должно быть 5,5, а не 6,5 – rnso
@rnso нет, я думаю, что вы искажая вопрос. – shadowtalker
@mso На самом деле, человек 36598035 сделал вход в систему 6 раз, только с двух разных IP-адресов. Я хотел бы сохранить тот факт, что человек регистрировался в 6 раз, независимо от того, с какого IP-адреса он/она вошел. Спасибо за вашу помощь! :) – waxattax