2016-12-30 3 views
1

Просматривая документацию по адресу TraMIner, я обнаружил, что самый простой способ построения 10 самых часто встречающихся последовательностей - seqfplot. Код ниже для mvad.Участок 20 наименее встречающихся последовательностей с использованием TraMiner в R

library(TraMineR) 
    data("mvad") 
    mvad.labels <- c("employment", "further education", "higher education", 
        "joblessness", "school", "training") 
    mvad.scode <- c("EM", "FE", "HE", "JL", "SC", "TR") 

    mvad.seq <- seqdef(mvad, 17:86, states = mvad.scode, labels = mvad.labels) 

    seqfplot(mvad.seq, withlegend = F, border = NA, title = "Sequence frequency 
    plot") 

Я хочу построить 20 наименее часто встречающихся последовательностей аналогичным образом. Есть ли удобный способ достичь этого?

ответ

3

Подсчитать количество различных последовательностей, а затем использовать Tlim построить последний 20.

l <- length(seqtab(mvad.seq, tlim = 1:1000)) 

seqfplot(mvad.seq, withlegend = F, border = NA, title = "Sequence frequency 
    plot", tlim=(l-20):l) 

enter image description here

Однако, это не имеет смысла: с большинством наборов данных, большое количество последовательностей будет уникальной и будет иметь частоту 1/n. Изучите результат seqtab(mvad.seq, tlim = 1:1000). Это означает, что:

  1. Сюжет будет показывать последовательности с одинаковой частотой: нет смысла нарисовать его.
  2. 20 "последних" последовательностей произвольно выбираются среди множества последовательностей частоты 1/n: они не являются последними, а являются их подмножеством.
Смежные вопросы