2016-08-25 2 views
3

У меня есть следующий код: RОтличаясь максимумов в R с помощью командой

library(ggplot2) 
data(diamonds) 
by(diamonds$price, diamonds$cut, summary) 
by(diamonds$price, diamonds$cut, max) 

Это дает мне:

diamonds$cut: Fair 
Min. 1st Qu. Median Mean 3rd Qu. Max. 
337 2050 3282 4359 5206 18570 
---------------------------------------------- 
    diamonds$cut: Good 
Min. 1st Qu. Median Mean 3rd Qu. Max. 
327 1145 3050 3929 5028 18790 
---------------------------------------------- 
    diamonds$cut: Very Good 
Min. 1st Qu. Median Mean 3rd Qu. Max. 
336  912 2648 3982 5373 18820 
---------------------------------------------- 
    diamonds$cut: Premium 
Min. 1st Qu. Median Mean 3rd Qu. Max. 
326 1046 3185 4584 6296 18820 
---------------------------------------------- 
    diamonds$cut: Ideal 
Min. 1st Qu. Median Mean 3rd Qu. Max. 
326  878 1810 3458 4678 18810 

diamonds$cut: Fair 
[1] 18574 
---------------------------------------------- 
    diamonds$cut: Good 
[1] 18788 
---------------------------------------------- 
    diamonds$cut: Very Good 
[1] 18818 
---------------------------------------------- 
    diamonds$cut: Premium 
[1] 18823 
---------------------------------------------- 
    diamonds$cut: Ideal 
[1] 18806 

Я не понимаю, почему максимумы этих двух таблиц отличаются. Разве максимумы не должны быть одинаковыми?

ответ

5

это цифры, рассуждение ?summary

by(diamonds$price, diamonds$cut, function(x) summary(x, digits = 10 ))` 

дают такой же, как максимум

+0

'цифр = 5' будет здесь достаточно. – mtoto

+0

Я нахожу это поведение первой строки «по (бриллианты $ price, diamonds $ cut, summary)» довольно странно. Как эта строка фактически вычисляет максимум для каждого случая? – Ohumeronen

Смежные вопросы