2014-11-25 6 views
0

У меня есть предварительно рассчитанные данные с количеством по оси x и количеством (в пропорции), которое я использую в качестве оси y.Предварительно агрегированные данные для построения

Что бы я хотел иметь, это функциональность, которую я получил бы, если бы использовал stat = "bin". Я не могу использовать rep, чтобы просто взорвать данные в исходную форму, а затем перестроить ее из-за большого размера набора данных.

Например: Я хотел был бы иметь возможность сгладить данные, как я мог бы с помощью бинарной ширины.

Кроме того, я рисую эти данные, используя geom_freqpoly. Однако, если у меня нет определенной суммы на оси x, я хотел бы иметь ее как значение 0 вместо того, чтобы присоединяться к следующей точке, которая делает биннинг с использованием ggplot.

ответ

0

Поскольку никто не ответил на ggplot, я использовал rep для повторного расширения и выборки данных.

Итак, если бы у меня было 18 миллионов наблюдений изначально, я использовал 180 000 для аргумента аргумента rep и умножал на это мою ранее рассчитанную пропорцию данных. Я не уверен, что тогда порог будет для аргумента times (если он меньше 1, то не будет создана точка данных?). Это означает, что я вообще теряю менее частые наблюдения, но в моем случае это нормально.

Смежные вопросы