Я создаю рассеянную диаграмму в ~ 300 тыс. Точек данных, и у меня возникает проблема, что она настолько переполнена в некоторых местах, что никакая структура не видна - так что у меня была мысль !Контуры участка для самой плотной области рассеянного участка
Я хочу, чтобы график создавал контурный график для самых плотных частей и оставлял менее плотные области с точками данных scatter()
.
Поэтому я пытался индивидуально вычислить расстояние между ближайшими соседями для каждой из точек данных, а затем, когда это расстояние достигло определенного значения, нарисуйте контур и заполните его, а затем, когда он достигнет гораздо большего значения (менее плотный) просто сделайте разброс ...
Я пробовал и терпел неудачу в течение нескольких дней, я не уверен, что условный контурный график будет работать в этом случае.
Я бы поставил код, но он настолько грязный и, вероятно, просто путают проблему. И это настолько интенсивно вычислительно, что, возможно, это просто разрушит мой компьютер, если он сработает!
Спасибо вам заранее!
p.s. Я искал и искал ответ! Я убежден, что это невозможно даже для всех результатов, которые он получил!
Редактировать: Таким образом, идея состоит в том, чтобы увидеть, где некоторые конкретные точки лежат в структуре образца 300k. Вот пример сюжета, мои точки разбросаны по трем разным. цвета.
Я попытаюсь случайным образом пробовать 1000 datapoints из моих данных и загружать их в текстовый файл. Приветствия штабелеры. :)
Edit: Эй, Вот некоторые примеры данных 1000 строк - всего две колонки [X,Y]
(или [g-i,i]
от участка выше) пространства с разделителями. Спасибо вам всем! the data
В зависимости от того, как переполненный эти значения, вы могли бы, вероятно, дразнить некоторую структуру из просто делая 'разброс (х, у, альфа = 0,1)' или какой-то подходящее малое значение. Чтобы сделать то, что вы предлагаете, я бы построил оценку плотности ядра (см. 'Scipy.stats.kde'). – chthonicdaemon
Почему вы не используете 2-гистограмму для отображения ваших данных? –
@FriskyGrub вы можете просто предоставить случайные данные того же типа/формы/etc, что и ваши реальные данные - вам не всегда нужно публиковать сложные шаги, которые генерировали реальные данные в первую очередь. Это облегчает нам предоставление ответов, которые вам полезны. – YXD