2014-12-11 7 views
1

Я использовал OpenNLP для Name Entity Recognition (NER). У них свои модели here. Но их домен NER не подходит с моим. Таким образом обучен свою собственную модель, используя этот кодOpenNLP сохранить подготовленную модель

  FileReader fileReader = new FileReader("res/review_train"); 
      ObjectStream fileStream = new PlainTextByLineStream(fileReader); 
      ObjectStream sampleStream = new NameSampleDataStream(fileStream); 
      TokenNameFinderModel model = NameFinderME.train("pt-br", "train", sampleStream, Collections.<String, Object>emptyMap()); 
      nfm = new NameFinderME(model); 

Здесь review_train это текстовый файл, содержащий подготовленный текст. Задача Каждый раз, когда я запускаю, для подготовки данных требуется слишком много времени. Есть ли способ сохранить эту обученную модель и повторно ее использовать?

ответ

1

Вы можете сохранить модель, используя этот код и повторно использовать без поезда снова и снова

BufferedOutputStream modelOut = new BufferedOutputStream(new FileOutputStream("filename")); 
model.serialize(modelOut); 
Смежные вопросы