2015-09-26 2 views
1

Все,Как обрабатывать очень большие данные с помощью таблицы

Я использую Tableau 9.0 для анализа данных. Мой набор данных очень большой, содержащий 100 миллиардов записей.

Я хочу использовать фильтр, чтобы сначала отфильтровать данные. Но, когда я пытаюсь добавить фильтр в конкретный столбец данных в Tableau, он продолжает работать ... навсегда. Причина в том, что tableau хочет показать мне все это значение поля в порядке возрастания, а затем разрешить мне делать выбор. например, для выбора только одного или двух значений для фильтрации ...

Но он продолжает работать из-за 100 миллиардов записей. Как решить эту проблему? Могу ли я отключить эту функцию (отобразить все значения конкретного поля ..)? Как фильтровать такие большие наборы данных?

Спасибо заранее

ответ

2

Пауза Авто-обновление с помощью кнопки панели инструментов паузы перед перетаскиванием поля для фильтра полки (или делать что-либо, что вы не хотите, чтобы запустить обновление запросов). Затем либо нажмите обновление, либо включите автообновление, когда вы хотите запустить запрос.

Для фильтра с дискретным размером вы можете ввести собственные списки значений, чтобы избежать запроса, чтобы заполнить список элементов в диалоговом окне фильтра.

+0

Спасибо. Алекс. Вы имеете в виду, что я также должен использовать пользовательский SQL-запрос в таблице, чтобы отфильтровать источник данных, чтобы получить меньшие рабочие данные, а затем перейдите на рабочий лист для анализа. – fzhurd

+0

Я имею в виду не использовать пользовательские SQL-запросы в Tableau, если вы сначала не убедились, что нет лучшей альтернативы. Пользовательский SQL полезен, но он поражает важные оптимизации запросов - он заставляет Tableau генерировать консервативные, возможно, чрезмерно дорогие запросы, потому что он не знает, что вы ввели в пользовательский SQL. Существует много альтернативных способов эффективного доступа к данным в Tableau. Пользовательский SQL - это универсальная функция, используемая в редких случаях, когда другие функции Tableau не дают вам нужных результатов. Даже тогда, более эффективно, чтобы сделать вид на вашу базу данных. –

+0

Для больших наборов данных вы можете сначала создать фильтр уровня источника данных, который уменьшит объем данных до меньшего подмножества. Или лучше, сделайте вырез с FILTERS, который уменьшит количество строк до небольшого подмножества и спрячет неиспользуемые поля, чтобы уменьшить количество столбцов. Затем вы можете быстро создать viz с быстрым извлечением, а затем указать исходный источник данных (снова с соответствующими фильтрами). НЕ пытайтесь сделать экстракт, который явно копирует весь набор данных. –

-1

Я не считаю, что это подходящий инструмент для такого большого набора данных. Но ознакомьтесь с этой статьей о производительности.
http://kb.tableau.com/articles/knowledgebase/database-query-performance

+0

Здравый подход к огромным наборам данных заключается в том, чтобы оставить данные в источнике, отправив запросы, которые возвращают результаты скромного размера, которые суммируют данные. Сумасшедший подход - выборка и отображение каждой строки данных. Объедините это с фильтрацией, кешированием и интерактивной разверткой в ​​подмножества. Скорость слоя представления зависит от того, какие запросы он отправляет и как быстро база данных может их выполнять. Это потребует тщательной настройки и исключает некоторые подходы, которые работают для меньших наборов данных. Эти факты одинаковы в любом инструменте визуализации, Tableau или в противном случае. –

1

вы можете улучшить свою производительность, учитывая следующее tips-

Use custom sql query in tableau to filter the data source to get the smaller working data.(data filtered at backend will be added advantage) 

Hide unwanted fields from the data source pane. 

Publish your data set to tableau server and then connect the tde server extract to tableau. 
Смежные вопросы