У меня есть ФР в следующей структуре:% в% Изменение dplyr пакета в R
Case.No Device.Phone.Number Repair.Code
123 111-111-1111 RA10
234 222-222-2222 RA21
345 111-111-1111 RA99
456 333-333-3333 RA01
567 222-222-2222 RA47
... ... ...
789 333-333-3333 RA90
Есть еще несколько 70 колонн, но не интерес к этому вопросу.
Я анализирую данные повторных звонящих (записи с тем же связанным с ними Device.Phone.Number). Мой текущий метод Подмножества этих данных из ФРА:
library("plyr", lib.loc="~/R/R-3.2.2/library")
Call.Count <- count(df$Device.Phone.Number)
Repeat.Calls <- Call.Count[Call.Count$freq > 1, ]
numbers <- Repeat.Calls[1:nrow(Repeat.Calls),1]
Repeat.Device <- df[df$Device.Phone.Number %in% numbers, ]
Я бы предпочел использовать пакет dplyr
по всему сценарию, но мое использование %in%
дает dataframe с 0 набли, если я использую функцию count
из dplyr
а не от plyr
.
Вопрос: Как я могу избежать этой проблемы? Мой скрипт будет намного более эффективным, если я смогу реализовать dplyr
с самого начала.
Как и в сторону, я знаю, что dplyr::count
использует «п» вместо «FREQ»
Я приложил dplyr
и изменил мой синтаксис, как это предписано @Konrad.
Call.Count <- count(Clean.CRM, Device.Phone.Number)
Repeat.Calls <- Call.Count[Call.Count$n > 1, ]
numbers <- Repeat.Calls[1:nrow(Repeat.Calls),1]
Repeat.Device <- All.CRM[All.CRM$Device.Phone.Number %in% numbers, ]
Но теперь с помощью %in%
в то время как dplyr
прилагается не работает.
Я предполагаю, что вы попадаете под атипичные правила подмножества dplyr. Что такое 'class (numbers)'? Это вектор или «tbl_df»? – Thomas
@Thomas - 'class (numbers)' returns '[1]" tbl_df "" data.frame "' –