Я понимаю, что это широкая тема, но я ищу хороший учебник по разбору смысла текста, в идеале в Python. В качестве примера того, что я ищу делать, если пользователь делает в блоге, как:Анализ текста из текста
«Мэнни Рамирес делает его возвращение к Доджерс сегодня против Хьюстона»,
что легкий вес/простой способ получить существительные из предложения? Чтобы начать, я думаю, что я ограничил бы его именами, но я бы не хотел ограничиваться только этим (и я не хочу полагаться на простое регулярное выражение, которое предполагает, что Title Capped является правильным существительным).
Чтобы сделать этот вопрос еще хуже, какие вещи я не прошу, чтобы я был? Нужен ли мне набор существующих слов для начала? Какой материал лексического анализа мне нужно знать, чтобы сделать эту работу? Я наткнулся на one other question по этой теме, и сейчас я просматриваю эти ресурсы.
Ха, я просто добавил это в свою корзину на Амазонке, прежде чем вернуться сюда. Это хорошо? Мне было интересно узнать об отсутствии отзывов. – Tom
Похоже, у него есть довольно приличное описание NTLK - инструментарий, упомянутый в одном из ответов – zakovyrya