2013-04-05 3 views
0

У меня есть таблица Excel, где каждый столбец является определенной переменной. В конце моих столбцов у меня есть специальный последний столбец под названием «Тип», который может быть A, B, C или D.Correlations/Data Mining в Microsoft Excel 2003

Каждая строка представляет собой точку данных с различными переменными, которая заканчивается определенным «типом», (A/B/C/D), записанных в последнем столбце.

Мне нужен способ изучить все записи определенного типа (скажем, «C» или «C» | «D») и выяснить, какая из переменных (-ов) является хорошим предиктором этого последнего столбца, и которые являются лучшими предикторами, чем другие.

Некоторые переменные являются числами, другие - фиксированными строками (из набора строк), поэтому это не только корреляция числа и числа.

Является ли Excel 2003 хорошим инструментом для этого, или есть ли более эффективные статистические программы, которые упрощают это? Создать ли сводку/гистограмму для каждой категории, или есть лучший способ запустить эти запросы? Спасибо

ответ

0

Вы можете сделать некоторую фильтрацию, особенно для очистки данных (я имею в виду, чтобы изменить значения данных в один тип, строку или цифру), используя microsoft excel. Execl также делает некоторые интеллектуальные данные. Однако для тех проблем, которые у вас есть, хороший инструмент, который я вам рекомендую, это WEKA. Используя этот инструмент, вы можете сделать ассоциативное прогнозирование классификации (т. Е. Интеллектуальное управление ассоциацией классов) всех экземпляров данных (строк), и, следовательно, вы можете определить, какие элементы относятся к A/B/C/D. Ваш специальный атрибут будет вашим атрибутом класса.

Смежные вопросы