Я использую RUTA и написал много разных правил для извлечения одного и того же объекта. Например, я выберу «фабрику туалетной бумаги». В настоящий момент моими правилами станут завод туалетной бумаги, бумажный завод и завод. Но меня интересует только самый длинный матч.UIMA Ruta Только комментировать длинное совпадение
Я создал минимальный пример:
DECLARE Test;
(CW CW) {-> CREATE(Test)};
(CW CW CW) {-> CREATE(Test)};
И мой тест-струнный:
lower lower Upper Upper Upper lower Upper
правило выше будет соответствовать верхам верхнего и Верхних Верхних Верхней. Но в этом случае меня интересует только результат последнего правила.
Можно ли убрать короткие спички?
Спасибо :) - Есть ли специальная РУТА версия, необходимая для первого решения? Я использую 2.3.1 Второе решение работает, но, как вы сказали, оно медленное. – PascalTurbo
Для первого решения требуется UIMA Ruta 2.5.0. Вы можете переписать это правило также для 2.3.1, например, используя БЛОК и тип в UNMARK –