2015-05-12 6 views
1

я имеют длину сегмента ДНК (по отношению к хромосоме руки, 251296 записей), как, например:Есть ли способ построить частотную гистограмму из непрерывной переменной?

0.24592963 
0.08555043 
0.02128725 
... 

Диапазон от 0 до 2, и я хотел бы сделать непрерывную относительную частоту участка. Я знаю, что могу использовать значения и использовать гистограмму, но я хотел бы показать непрерывность. Есть ли простая стратегия? Если нет, я буду использовать биннинг. Спасибо!

РЕДАКТИРОВАТЬ:

Я создал вектор биннинга с 40 равноотстоящих значений от 0 до 2 (включительно). Для простоты существует ли способ округлить каждую из 251296 записей до ближайшего значения в векторе binning? Спасибо!

+0

Когда вы говорите «непрерывный частость участок» вы имеете в виду, что некоторые из ваших 251,296 записей дублируются, и вы хотите, эта частота будет построена на оси у? –

+0

Используйте график плотности ядра. Есть несколько способов сделать это в R (или любом другом программном обеспечении), если вы посмотрите на него. – Frank

+0

@ NathanS.Watson-Haigh Привет! Я имею в виду, что значения взяты из непрерывной переменной. Могут быть некоторые дубликаты. :) – Johnathan

ответ

2

Учитывая, что большинство ваших значений не дублируются и, следовательно, не имеют простого способа получить значение для построения по оси y, я бы, вероятно, пошел на график плотности. Это будет указывать на длину плотных сегментов, т. Е. Где у вас много длин сегментов, встречающихся рядом друг с другом.

d <- c(0.24592963, 0.08555043, 0.02128725) 
plot(density(d), xlab="DNA Segment Length", xlim=c(0,2)) 

enter image description here

+0

Здравствуй! Спасибо за быстрый ответ. Я сделал это, и это выглядит красиво. Тем не менее, я хотел бы, чтобы некоторые сегменты вблизи значения отображались. Итак, я думаю, что я использую относительную гистограмму И построим функцию плотности. – Johnathan

Смежные вопросы