2015-03-05 3 views
0

Установка: у меня есть данные об использовании энергии из кучи зданий, построенных в кучу разных лет. Я бы хотел проанализировать использование энергии по дате, построенной в Таблице. Моя первоначальная проблема заключалась в том, что в образце не было достаточного количества зданий, чтобы иметь надежный набор для каждого года, а итоговые результаты показывают тонну шума. Распределение искажено правильно, так как существует ряд высоких выбросов, но нет выбросов, близких к 0, поэтому я бы хотел использовать медиану, чтобы уменьшить эффект нескольких (и, вероятно, ошибочных) высоких выбросов.«Moving Median» в таблице

Желаемое решение: Создайте 5-летнюю «движущуюся» или «бегущую» медианную, которая включает в себя все здания в течение двух лет в любом направлении данного года, чтобы каждый комплект был ориентирован на год.

Что я пытался в таблице: Я хотел использовать WINDOW_MEDIAN ([ENERGY], - 2,2), но это функция агрегата. Поэтому я попробовал WINDOW_MEDIAN (MEDIAN ([ENERGY], - 2,2). К сожалению, это дает мне медиану из 5 медианов (Median-of-Medians ?! Boo!). Опять же, я бы хотел иметь медиану все отдельные здания (не суммируются медианы), представленные в каждом окне 5 лет.

Любые мысли о том, как это сделать? Спасибо!

ответ

0

при определении вычисления таблицы, необходимо указать дополнительную информацию, не ограничиваясь только расчет сама формула - рассказать Таблице о том, как разбить результирующий набор, какие размеры будут перемещаться (адрес) и в каком порядке.

Вы видите некоторые из этих вариантов в меню «Вычислить использование», которое часто все, что вам нужно, но более явно выбрав «Расчет таблицы» и выбрав «Дополнительно» для опции «Запуск».

Реальная проблема заключается в определении уровня детализации для расчета, который вы хотите.

Табличные вычисления по определению действуют на агрегированные результаты, возвращаемые в таблицу, источником данных - в отличие от других расчетов, которые выполняются источником данных. Это означает, что если вы хотите, чтобы ваш расчет таблицы вычислял медиану, рассматривая каждую строку в вашем наборе данных, тогда Tableau должен запрашивать данные на тонком уровне детализации. Вы можете это сделать, включив в свое представление некоторую комбинацию измерений, которая однозначно идентифицирует каждую строку в ваших данных (думаю, первичный ключ). Это расширит агрегированные результаты, данные Таблице, чтобы получить все данные, необходимые для медианного расчета.

В этот момент вам необходимо указать, какие измерения использовать для адресации, адресации и заказа для вашей таблицы, вероятно, на расширенной панели, упомянутой выше. В сети есть несколько хороших обучающих программ, но эксперимент тоже хороший учитель.

Вам все равно потребуется функция агрегации вокруг [ENERGY], но поскольку каждый блок строк данных должен иметь только строку, то функция агрегации не имеет большого эффекта. Обычно я выбираю MIN(), но MAX(), AVG(), MEDIAN() имеют одинаковый эффект, когда в разделе есть только одна строка.