У меня есть сценарий python, который получает текстовые сообщения от пользователей и обрабатывает их как запрос. Тем не менее, некоторые пользователи имеют подписи, автоматически добавляемые к их сообщениям, и сценарий неправильно рассматривает их как фактическое содержимое. Каков наилучший программный способ распознавания и удаления этих подписей?Удалить подпись из полученного сообщения
(я предпочел бы в питоне, но я хорошо с любым другим языком тоже, как и просто сказать это в псевдокоде)
Не могли бы вы объяснить немного больше о том, как будет работать классификатор? – yydl
@Joseph: Классификатор представляет собой алгоритм, такой как нейронная сеть, SVM или байесовский фильтр, который «обучен» на известном корпусе, а затем применяется к неизвестному корпусу (возможно, с обратной связью, когда он делает ошибку). Реализация одного нетривиальна. – Borealid