2014-02-14 3 views
1

Я использую PSPP (не SPSS, так как я не могу получить это на моей машине Ubuntu) и имея набор записей ~ 100k, кластерный с кластером k-значений. Теперь мне действительно нужен более подробный вывод, чем количество записей в каждом кластере. Мне нужна переменная кластера сохраненную т.е.Сохранять переменные кластера/переменные PSPP

ряд 1 => кластер 1

строка 2 => кластер 4

строка 3 => кластер 1

и т.д ...

По существу Мне нужно дополнительное поле, которое сохраняет полученную кластерную близость каждой записи. Мой текущий синтаксис:

QUICK CLUSTER cat1 cat2 cat3 cat4 cat5 cat6 cat7 cat8 cat9 cat10 cat11 cat12 
/CRITERIA=CLUSTERS(12) MXITER(100000000). 

SPSS и ГАЭС имеет много одного и тот же синтаксис, так что если есть возможность в SPSS может работать здесь.

ответ

1

Статистика должна работать на Ubuntu, но статистика БЫСТРАЯ команда Кластер имеет субкоманды

/SAVE CLUSTER

, которые должны делать то, что вы хотите. Вы можете указать имя переменной в круглых скобках после CLUSTER.

0

PSPP не обрабатывает/SAVE CLUSTER подкоманду. Попробуйте!

QUICK CLUSTER var_list 
     [/CRITERIA=CLUSTERS(k) [MXITER(max_iter)] CONVERGE(epsilon) [NOINITIAL]] 
     [/MISSING={EXCLUDE,INCLUDE} {LISTWISE, PAIRWISE}] 
     [/PRINT={INITIAL} {CLUSTER}] 

Посмотреть на GNU page of PSPP

Смежные вопросы