Я ищу, чтобы распознавать простые фразы, подобные тем, что происходит в google calendar , но вместо того, чтобы анализировать записи в календаре Мне нужно проанализировать предложения, связанные с финансами, учетными записями и списками. Так, например, я должен проанализировать предложения, какПростые определения фраз
Я потратил 50 долларов на еду вчера
мне нужно пометить отдельный информацию как Reason : 'food'
, Cost : 50
и Time: <Yesterday's Date>
Мой вопрос, это сделать Я занимаюсь полноценной обработкой естественного языка, например , приведенной в этих Вопросах и использую что-то вроде GATE
Machine Learning and Natural Language Processing
Natural Language Processing in Ruby
Ideas for Natural Language Processing project?
https://stackoverflow.com/a/3058063/492561
Или лучше писать простые грамматик, используя что-то вроде Antlr и пытается распознать его.
Или должен ли я пойти очень низко и просто определить синтаксис и использовать регулярные выражения.
Время ограничено, у меня около 45 - 50 дней, и я не знаю, как использовать библиотеки AntLR или NLP, такие как GATE.
Предпочтительные языки: Python, Java, Ruby (не в определенном порядке)
PS: Это не домашняя работа, поэтому, пожалуйста, не маркируют это как так.
PPS: Пожалуйста, попробуйте дать ответ с фактами о том, почему лучше использовать конкретный метод. , даже если какой-либо конкретный метод может не соответствовать внутреннему ограничению времени, не стесняйтесь делиться им, потому что он может принести пользу кому-то другому.
Вы действительно ищете грамматику для обработки естественного языка здесь ... Если Java, вы могли бы подумать об отвращении. Но определение _grammar_ будет самой сложной частью всего, независимо от используемого вами инструмента. Удачи! – fge
Спасибо за это @fge. Не могли бы вы рассказать об этом с некоторыми ссылками, если это возможно, и опубликовать его как ответ – Gautam
@fge, после упоминания NLP вы говорите о 'parboiled', но этот инструмент является PEG-парсером, а не инструмент НЛП. Если OP решит использовать инструмент NLP, вероятно, нет необходимости возиться с любыми грамматиками: такие инструменты поставляются вместе с несколькими предопределенными языками (грамматиками). –