Как суммировать одну колонку на основе другой колонки

-1

это мой первый пост, поэтому, пожалуйста, извините за любые нарушения. Я работаю над текстовым анализом с помощью R, и в настоящее время я пытаюсь суммировать столбцы моего кадра данных, обусловленные другим столбцом. В частности, выглядит мои результаты «dfResults» следующим образом:Как суммировать одну колонку на основе другой колонки

dfResults

Я хочу, чтобы подсчитать частоту слов для всех положительных слов (1) и отдельно частота всех отрицательных слов (-1), так что я могу легко вычислить оценку настроений. Это, наверное, очень просто, но я пробовал функции суммирования и суммирования, и это не сработало. Поблагодарите за помощь!

источник

2016-12-06 Vincent Coon

group by 'sentiment', а затем сумма freq –

Пожалуйста, покажите свой код и набор данных, которые вы пишете в R. –

-1

Надежда это то, что вы хотите:

library(dplyr) 
data %>% group_by(sentiment) %>% summarise(x = sum(freq))

источник

2016-12-06 10:06:36

не могли бы вы проголосовать? человек, который –

-1

Обе вышеуказанные ответы будут работать. Кроме того, если вы хотите сделать это без использования какой-либо библиотеки, базовый путь, то у вас есть как минимум два варианта

split() данные и суммировать полученные списки с lapply/sapply ИЛИ
use aggregate()

lapply ((split(df$freq,df$sentiment)), sum)  
    aggregate(df$freq, by=list(df$sentiment), FUN=sum)

Редактировать/Correction - aggregate не из базы, но из stats пакета. Однако, учитывая, что stats тоже является одним из пакетов по умолчанию, он доступен в сеансе R.

источник

2016-12-06 11:30:12

Как суммировать одну колонку на основе другой колонки

ответ

Смежные вопросы