У меня есть две таблицы данных в виде столбцов, а именно пара болезней и их меры как пара. Ниже первая одна (выборочные данные) disease_table1График построения в R
**d1** **d2** **Value**
Disease1 Disease2 3.5
Disease3 Disease4 5
Disease5 Disease6 1.1
Disease1 Disease3 2.4
Disease6 Disease2 6.7
реальный Dataset 1 (disease_table1) ниже:
Bladder cancer X-linked ichthyosis (XLI) 3.5
Leukocyte adhesion deficiency (LAD) Aldosterone synthase Deficiency 1.8
Leukocyte adhesion deficiency (LAD) Brain Cancer 1.5
Tangier disease Pancreatic cancer 0.66
Я хочу, чтобы показать разницу между этими двумя таблицами данных, в то время как построение пар болезни и его значения для обеих таблиц. Я использовал функцию графика и функцию линий, но ее слишком просто, и я не могу отличить много. Также я хотел бы иметь имена пар болезней при построении графика.
plot(density(disease_table1$value))
lines(density(disease_table1$value))
Благодаря
Не могли бы вы предоставить нам [воспроизводимый пример] (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)? – Jaap
Я добавил реальный набор данных, код в качестве примера. – Rgeek
С 400 000 + пар болезней вам, вероятно, нужен подход кластеризации. можете ли вы разместить ссылку на свои данные или более представительное подмножество, скажем, несколько тысяч записей? – jlhoward