Я только что реализовал программу, использующую теггер Stores Stanford в Java.Увеличение производительности программы на основе Stanford-tagger
Я использовал входной файл размером в несколько КБ, состоящий из нескольких сотен слов. Я даже установил размер кучи до 600 МБ.
Но он все еще медленный и иногда заканчивается из памяти кучи. Как увеличить скорость выполнения и производительность памяти? Я хотел бы иметь возможность использовать несколько МБ в качестве входных данных.
public static void postag(String args) throws ClassNotFoundException
{
try
{
File filein=new File("c://input.txt");
String content = FileUtils.readFileToString(filein);
MaxentTagger tagger = new MaxentTagger("postagging/wsj-0-18-bidirectional-distsim.tagger");
String tagged = tagger.tagString(content);
try
{
File file = new File("c://output.txt");
if (!file.exists())
{
file.createNewFile();
}
FileWriter fw = new FileWriter(file.getAbsoluteFile());
BufferedWriter bw = new BufferedWriter(fw);
bw.write("\n"+tagged);
bw.close();
}
catch (IOException e)
{
e.printStackTrace();
}
} catch (IOException e1)
{
e1.printStackTrace();
}
}
спасибо. Будет использовать Left3words :) – Ameer