Я пишу программу, которая должна выплюнуть случайное предложение сложности по моему выбору. В качестве конкретного примера я хотел бы помочь в изучении языка, выплескивая правильные предложения грамматической структуры и используя слова, которые я уже изучил. Я хотел бы использовать python и nltk для этого, хотя я открыт для других идей.Создать произвольное предложение из грамматики или Ngrams?
Похоже, что пара подходов:
- Определить файл грамматики, который использует грамматику и словарный запас, я знаю о том, а затем генерировать все допустимые предложения из этого списка, а затем выбрать случайный ответ.
- Загрузите в корпус для обучения ngrams, которые затем могут быть использованы для построения предложения.
Я думаю об этом правильно? Один подход предпочтительнее другого? Любые советы приветствуются. Благодаря!
см. Http://www.icml-2011.org/papers/524_icmlpaper.pdf и http://www.fit.vutbr.cz/~imikolov/rnnlm/ – alvas