2012-03-18 2 views
4

Пример:
У меня есть 100 образцов в течение определенного периода времени. Но я могу использовать только 10 значений для построения линейной диаграммы. Какой алгоритм я могу использовать для вычисления этих 10 репрезентативных значений, чтобы диаграмма выглядела одинаково, если бы я использовал все 100 точных образцов для ее рисования.Алгоритм выбора репрезентативных образцов для диаграммы

Наивный алгоритм, который вычисляет среднее значение для каждого из следующих 10 выборок, не очень хорошо отражает пики на диаграмме.

+0

Если вы ничего не знаете о входном сигнале, вы не получите намного больше, чем простое среднее. – Sword22

ответ

6

Вы можете использовать алгоритм Douglas-Peucker, чтобы получить оптимальное представление без выборки.

Алгоритм строит набор под выборку, начиная с только конечных точек исходного набора данных. На каждом шаге в набор с невыбранными выборками добавляется точка в исходном наборе данных, которая является «наиболее удаленной» (максимальной ошибкой) из недокалиброванного представления. Таким образом, алгоритм включает в себя важные пики в исходном наборе данных и строит недосэмплированное представление минимальной ошибки.

Так как вы разрешены только 10 очков в вашем под отобранным набор вы могли настроить алгоритм только расти под дискретизацией набора для размера 10.

Если у вас есть оригинальный набор данных, который включает в себя слишком много пиков нет никакого способа, чтобы вы могли захватить их все и удовлетворить ограничение размера.

Надеюсь, это поможет.

+0

+1, но поскольку может быть только 10 образцов, это не максимум пять пиков (из-за пяти желобов, необходимых для разделения пиков). –

+0

100 и 10 были только демонстрацией. В действительности число репрезентативных значений равно 200, а количество образцов может быть 1000 или 10000. –

+0

Кажется, что алгоритм Рамера-Дугласа-Пьюкера выбирает репрезентативные значения всегда из данных выборок. Однако мое требование слабее. Репрезентативное значение может быть рассчитано и не должно быть одного значения exac, взятого из образцов. –

Смежные вопросы