2014-11-01 2 views
0

Я использую Stanford POS tagger с GATE Twitter model, а теггер занимает около 3 секунд для инициализации, это нормально или я загружаю его неправильно?Стэнфордский POS-теггер с GATE twitter модель медленная

Небольшой пример код:

package tweet.nlp.test; 

import edu.stanford.nlp.tagger.maxent.MaxentTagger; 

public class TweetNLPTest { 

    public static void main(String[] args) { 
     String text = "My sister won't tell me where she hid my food. She's fueling my anorexia. #bestsisteraward #not "; 

     MaxentTagger tagger = new MaxentTagger("models/gate-EN-twitter.model"); 

     String taggedText = tagger.tagString(text); 
    } 
} 

Выход:

Чтения POS Таггер модель от моделей/гейт-EN-twitter.model ... предупреждения: нет языка набора , не указаны теги открытого класса и не указаны теги закрытого класса ; предполагая, что ВСЕ теги являются открытыми тегами класса сделано [3,1 сек].

My_PRP $ sister_NN won't_MD tell_VB me_PRP where_WRB she_PRP hid_VBD my_PRP $ food._NN She's_VBZ fueling_VBG my_PRP $ anorexia._NN #bestsisteraward_HT #not_HT _HT BUILD SUCCESSFUL (всего: 3 секунды)

+1

кажется нормальным для меня. – Yasen

+0

@ Ясен Я думал, может быть, я не делаю этого правильно, потому что модель GATE имеет расширение '.model', а другие модели имеют расширение' .tagger'. Что не имеет ничего общего с этим? –

ответ

2

Для меня это выглядит нормально, для инициализации требуется около 2 или 3 секунд. .tagger совпадает с .model.

Вы можете увидеть это в моделях образцов, предоставленных Стэнфордского Tagger:

model = wsj-0-18-bidirectional-nodistsim.tagger 
+0

Ну, по крайней мере, я нашел кого-то, чтобы дать репутацию: P –

+0

Другое дело, я действительно не понимаю, хотите ли вы использовать API GATE, но если это так, вы можете создать новый StanfordTaggerPR, такой как 'pr = (LanguageAnalyser) Factory.createResource ("gate.stanford.Tagger", params, features); ' –

+0

Хорошо, спасибо! –

Смежные вопросы