У меня есть таблица Excel, где каждый столбец является определенной переменной. В конце моих столбцов у меня есть специальный последний столбец под названием «Тип», который может быть A, B, C или D.Correlations/Data Mining в Microsoft Excel 2003
Каждая строка представляет собой точку данных с различными переменными, которая заканчивается определенным «типом», (A/B/C/D), записанных в последнем столбце.
Мне нужен способ изучить все записи определенного типа (скажем, «C» или «C» | «D») и выяснить, какая из переменных (-ов) является хорошим предиктором этого последнего столбца, и которые являются лучшими предикторами, чем другие.
Некоторые переменные являются числами, другие - фиксированными строками (из набора строк), поэтому это не только корреляция числа и числа.
Является ли Excel 2003 хорошим инструментом для этого, или есть ли более эффективные статистические программы, которые упрощают это? Создать ли сводку/гистограмму для каждой категории, или есть лучший способ запустить эти запросы? Спасибо