В SparkR У меня есть DataFrame data
содержит id
, amount_spent
и amount_won
.Как вычесть элементы в DataFrame
Например, для ид = 1 мы имеем
head(filter(data, data$id==1))
и выход
1 30 10
1 40 100
1 22 80
1 14 2
До сих пор я хочу знать, если фиксированный идентификатор более выиграл, чем потери. Сумма может быть проигнорирована.
В R Я могу заставить его работать, но требуется время. Скажем, у нас есть 100 идентификаторов. В R я сделал это
w=c()
for(j in 1:100){
# Making it local for a fixed id
q=collect(filter(data, data$id==j))
# Checking the difference. 1 means wins and 0 means losses
if(as.numeric(q$amount_won) - as.numeric(q$amount_spent)>0 {
w[j]=1
}
else{w[j]=0}
}
Теперь w просто дает мне 1 и 0 для всех идентификаторов. В sparkR я хочу сделать это более быстрым способом.
Да, это имеет смысл. Как подсчитать общее количество выигранных = ЛОЖЬ и ИСТИННО? –
Подсчитано общее количество игр, всего выигранных игр и процент выигранных игр. –