2013-12-18 2 views
3

Если у меня есть набор объектов, некоторые из которых разделяют определенные дискретные свойства (например, A, B, C, D, установленные на 1 или 0), как я мог визуализировать покрытие и перекрытия эти свойства в наборе данных?Лучший способ визуализации совпадений данных в R

например.

 id A B C D 
    1 34 1 0 0 1 
    2 56 1 1 1 1 
    3 14 0 0 1 1 
    4 90 0 0 1 0 

Я использую R в первую очередь, и попытались некоторые из диаграммы Венна участков пакетов, но это на самом деле не масштабируемые последние 5 измерений.

Есть ли другой пакет визуализации, который лучше подходит для этого?

+1

«Heatmap» может работать – James

ответ

3

Мое предложение, вероятно, не из вашей первоначальной цели визуализации набора данных, но это может быть способ: рассмотреть визуализацию попарных расстояний между любыми двумя наблюдениями (строками). Поскольку у вас есть двоичные данные, вы можете использовать любую дистанционную меру, подходящую для этого типа данных, см., Например, документ под названием «Обзор мер бинарного сходства». После этого вы можете рассмотреть кластеризацию на основе рассчитанных дистанционных мер, так что у вас будут карты тепла и другие инструменты визуализации, обычно используемые из результатов иерархической кластеризации.

+1

Спасибо, мне дают некоторые хорошие указания. Я думал, возможно, что-то похожее на градиентный спуск, но мне не нужно делать прогнозы на модели, просто нужно свертывать измерения. Никогда не пробовал нагреватель, должен быть интересный опыт! – JoeKir

+0

@JoeKir: Добро пожаловать. Обязательно проверьте функцию «heatmap.2» в пакете 'gplots' R, который является расширенной версией функции« heatmap »в R. – alittleboy

Смежные вопросы