2014-12-27 6 views
0

В документации я буду видеть, называть Java-класс с Params:Stanford Parser - железно ввода спецификации

ява edu.stanford.nlp.parser.nndep.DependencyParser -tlp edu.stanford.nlp.trees.international .pennchinese.ChineseTreebankLanguagePack -trainFile китайский/train.conll -devFile китайский/dev.conll -embedFile китайский/embeddings.txt -embeddingSize 50 -модели nndep.chinese.model.txt.gz

Где я могу найти спецификацию по этим 3 файлам?

китайский/train.conll - это поезд файл (спецификация на нем http://ilk.uvt.nl/conll/#dataformat)

китайский/dev.conll - что это такое?

китайский/embeddings.txt - что это такое?

ответ

1

chinese/train.conll, chinese/dev.conll: Это файлы обучения/dev в формате CoNLL 2006, как описано в разделе 4.1 документа: http://cs.stanford.edu/~danqi/papers/emnlp2014.pdf. (В общем случае у нас нет разрешения распространять наборы данных для других.)

chinese/embeddings.txt: Это словарные вложения, обучаемые с помощью word2vec, как описано в разделе 3.2 того же документа.

Смежные вопросы