Я пытаюсь построить гистограмму с использованием ggplot2 с процентом по оси Y и числовыми значениями по оси x.Графическая гистограмма с процентами в ggplot2
Образец моих данных и сценариев выглядит так (ниже) и продолжается примерно для 100 000 строк (или более).
A B
0.2 x
1 y
0.995 x
0.5 x
0.5 x
0.2 y
ggplot(data, aes(A, colour=B)) + geom_bar() +stat_bin(breaks=seq(0,1, by=0.05)) + scale_y_continuous(labels = percent)
Я хочу знать, какой процент значений В распределенном в каждом мусорном ведре значения, а не количество значений B в качестве значения.
Код, который теперь дает мне ось y с ymax как 15000. Предполагается, что ось Y находится в процентах (0-100).
Да! Однако, когда я пытаюсь добавить частотный столбец с использованием первой строки, мои данные сокращаются, а некоторые значения B отсутствуют. – Mengll
@Mengll, извините, но я не совсем понимаю, что вы имеете в виду. Таблица частот, которая преобразуется в кадр данных, является агрегированной версией исходного фрейма данных, поэтому да, ваши данные будут «сокращены». Скажем, у вас 500 строк y = 0,5. Они будут сжиматься до одной строки процента от y в «bin» 0.5. – Henrik
Я этого не понимал, но теперь это имеет смысл. Мой итоговый сюжет выглядит странно, но, вероятно, из-за моего собственного набора данных. Спасибо! – Mengll