Я пытаюсь прочитать о НЛП в целом и nltk, специально для использования с python. Я точно не знаю, есть ли там что-то там, или, возможно, мне нужно его развить.Угадайте теги абзаца программным путем с помощью python
У меня есть программа, которая собирает текст из разных файлов, текст чрезвычайно случайный и говорит о разных вещах. Каждый файл содержит абзац или 3 максимум, моя программа открывает файлы и сохраняет их в таблице.
Вопрос в том, могу ли я догадываться о тегах, о которых идет речь? если кто-нибудь знает о существующих технологиях или подходах, я был бы очень признателен.
Спасибо,
Поскольку теги имеют тенденцию быть существительными, если вы можете найти все существительные в абзаце и подсчитать их, что может быть наивным решением. Проблема в том, что в двух параграфах речь идет о львах и тиграх, которые вы, вероятно, захотите на этикетке «кошек». Если это то, что вы ищете, вам нужно будет использовать словарь ассоциаций и перекрестно проверить их. –