У меня есть фрейм данных DF.data.frame Группа По столбцу
Say ФР:
A B
1 1 2
2 1 3
3 2 3
4 3 5
5 3 6
Теперь я хочу, чтобы объединить вместе строк в столбце А и иметь сумму столбца B.
Например:
A B
1 1 5
2 2 3
3 3 11
Я делаю это в настоящее время с использованием SQL-запроса с функцией sqldf. Но почему-то это очень медленно. Есть ли более удобный способ сделать это? Я мог бы сделать это вручную, используя цикл for, но он снова медленный. Мой SQL-запрос: «Выберите A, Count (B) из DF-группы через A».
Обычно, когда я не использую векторизованные операции, и я использую для циклов, производительность очень медленная даже для отдельных процедур.
+1 но что «если данные большие», то спецификатор совершенно не нужен imo – eddi
@eddi, я бы согласился, если бы мы могли использовать синтаксис data.table, который находится на 'data.frame', но если у меня есть небольшой набор данных уже загружен, и я просто хочу получить быстрый ответ на проблему, подобную этой, я очень рад просто использовать 'aggregate'. Давайте просто скажем, что я не полностью преобразован в автоматическое использование всех моих данных в качестве 'data.table'. :) – A5C1D2H2I1M1N2O1R2T1