Вот мой код:Получение журнала правдоподобия из вероятностного дерева суффиксов
library(RCurl)
library(TraMineR)
library(PST)
x <- getURL("https://gist.githubusercontent.com/aronlindberg/08228977353bf6dc2edb3ec121f54a29/raw/c2539d06771317c5f4c8d3a2052a73fc485a09c6/challenge_level.csv")
data <- read.csv(text = x)
# Load and transform data
data <- read.table("thread_level.csv", sep = ",", header = F, stringsAsFactors = F)
data.seq <- seqdef(data[2:nrow(data),2:ncol(data)], missing = "NA", right = "*")
# Make a tree
S1 <- pstree(data.seq, ymin = 0.05, L = 6, lik = TRUE, with.missing = F)
logLik(S1)
По какой-то причине он отказывается возвращать значение логарифмического правдоподобия? Почему это так? Как я могу получить значение логарифмического правдоподобия?
Однако, все мои пропущенных значений находятся справа - там нет ни одного отсутствующего значения «внутри» из последовательности. Следовательно, примерно 90% всех моих событий - '*'. Разве это не исказит вероятности? – histelheim
Например, когда я делаю 'cmine (S1, pmin = 0, state =" good_idea ", l = 1)' Я получаю вероятность 'e', что составляет 47% - это не должно быть возможным с этим набором данных , так как никакая последовательность не начинается с '*'. – histelheim
Я отредактировал ответ, чтобы показать, как игнорировать недостающий конец последовательностей. И, вы правы, мы получаем «NA» logLik.Я предлагаю вам спросить автора пакета о том, что этот 'logLik' должен быть (он не возвращает то же значение, что и метод, который я предлагаю в ответе!). – Gilbert