У меня есть ресурс, где я точно знаю типы слов. я должен их леммами, но для правильных результатов я должен вручную пометить их. Я не мог найти код для ручной маркировки слов. i m, используя следующий код, но он возвращает неверный результат. то есть «живопись» для «живописи», где я ожидаю «краски».Ручная маркировка слов с использованием Stanford CorNLP
*//...........lemmatization starts........................
Properties props = new Properties();
props.put("annotators", "tokenize, ssplit, pos, lemma");
StanfordCoreNLP pipeline = new StanfordCoreNLP(props, false);
String text = "painting";
Annotation document = pipeline.process(text);
List<edu.stanford.nlp.util.CoreMap> sentences = document.get(SentencesAnnotation.class);
for(edu.stanford.nlp.util.CoreMap sentence: sentences)
{
for(CoreLabel token: sentence.get(TokensAnnotation.class))
{
String word = token.get(TextAnnotation.class);
String lemma = token.get(LemmaAnnotation.class);
System.out.println("lemmatized version :" + lemma);
}
}
//...........lemmatization ends.........................*
Мне нужно запустить лемматизатор на словах, а не предложения, где пометка будет выполняться автоматически. поэтому сначала я должен вручную пометить слова, а затем найти их лемму. помощь с некоторым примером кода или ссылкой на какой-то сайт будет большой помощью.
Точно то, что я хотел. – jaykio77