2009-12-31 2 views
0

Что было бы разумным способом хранения текста, чтобы он мог разумно разбираться и транслироваться позже.Интеллектуальный синтаксический анализ текста и перевод

Например, работник является выдающимся, поскольку он может идентифицировать свои сильные и слабые стороны и комфортно с самим собой.

Вышеупомянутый может быть общим текстом, который показывается пользователю перед оценкой. Если пользователь является мужчиной (скажем, Шон) или женщиной (скажем, Мэри), приведенный выше текст следует перевести следующим образом.

Мария выдающаяся, поскольку она может идентифицировать свои сильные и слабые стороны и комфортно с ней.

Shaun является выдающимся, поскольку он может идентифицировать свои сильные и слабые стороны и комфортно с самим собой.

  1. Как мы храним критерии оценки в первую очередь с соответствующими местами или держателями токенов. (В приведенном выше случае работник должен быть переведен на имя сотрудника и на основании его пола слова, которые он или она должен сам перевести)

  2. Есть ли механизм автоматического перевода текста с вышеуказанной информацией.

+0

Ну, перевод слов на основе пола должен быть достаточно простым ... но сколько других словосочетаний у вас будет, как [Сотрудник]? Почему это входной текст? Кто пишет это? Если вы находитесь под контролем, вы должны использовать какой-то шаблон вместо «», поскольку может идентифицировать собственный ... » – mpen

+0

Текст ввода принадлежит автору (ами), ответственным за создание различных таких шаблонов , Не знаете, как сообщить автору (ов), список всех переменных параметров, которые поддерживаются или могут быть переведены «на лету». – Joe

ответ

3

Основная идея делать что-то подобное называется Mail Merge.
This page Кажется, discus, как реализовать что-то подобное в Ruby.

[Редактировать]
Поиск Google дал мне это - http://freemarker.org/ alt text http://freemarker.org/images/overview.png
Я много об этой библиотеке не знаю, но это выглядит как то, что вам нужно.

+0

Объяснение полезно, но я ищу решение на базе Java. – Joe

1

Это очень широкий вопрос в поле Natural Language Processing. Есть много способов обойти это, заданные вами вопросы кажутся слишком широкими.

Если я правильно понял часть Вашего вопроса это может быть сделано таким образом:

@variable {имя} является выдающимся, как @gender {он/она} может определить @gender {его/ее} собственный сильные и слабые стороны и удобно с @gender {сам себя}.

Или:

@name является выдающимся, как @he может определить @his свои сильные и слабые стороны и комфортно с @himself.

... если гендер является основной проблемой.

+0

В настоящее время список переменных параметров ограничен именем, пол (он | она, он | ее, сам | себя) ... – Joe

1

У меня был некоторый опыт работы с инструментом под названием Grammatica, при построении пользовательского ввода отлично, как синтаксический анализатор и механизм оценки. Это может быть не тот уровень сложности, который вы ищете, но это начало. Это в основном использует многие из тех же понятий, которые используют популярные парсеры компилятора кода. Это определенно стоит проверить.

0

Я согласен с Kornel, этот вопрос слишком широк.То, о чем вы говорите, это семантика, для которой RDF и OWL могут быть хорошей отправной точкой. Читайте о семантике моделирования с использованием разметки, и вы можете проложить себе путь оттуда.

+0

Я предпочел бы более простой подход по сравнению с RDF, OWL, с которым я не знаком. – Joe

Смежные вопросы