Во-первых, я не уверен в этом ответе; но я надеюсь, что это поможет вам. Что вы просили, должно быть расположено по следующей ссылке: POS tag set does the parser use? (но, к сожалению, есть много сломанных ссылок!).
Как уже упоминалось, вы можете найти набор тегов (вы назвали метки) в следующем файле atb1-v4.1-taglist-conversion-to-PennPOS-forrelease.lisp. Насколько я понимаю, они отображают одну или несколько последовательностей английских тегов на один или несколько арабских тегов. например: отображение:
(DET + ADJ_COMP + NSUFF_MASC_DU_GEN DT + Jjr)
означает, что мы преобразуем английскую последовательность тегов (DET + ADJ_COMP + NSUFF_MASC_DU_GEN) до арабских тегов (DT + JJR).
Что касается вашего вопроса (المدرسة/DTNN), они упомянули, что он состоит из двух тегов (DT + NN), где DT = (ال) (произносится как «Al») и NN = (существительное, особая или масса) см. Penn Treebank.
возможно дубликат [Java Стэнфордского NLP: Часть речи меток] (http://stackoverflow.com/questions/1833252/java-stanford-nlp -режиссер-метки) – houssam
@houssam Я ищу значение арабских ярлыков тегов, а не английских. –
Вы правы, я думал, что они используют один и тот же набор тегов; Надеюсь, мой ответ будет полезен для вас. – houssam