Я новичок в НЛП, и мне нужно решить упражнение для моего класса НЛП. В принципе, я получаю исходный текст, содержащий аббревиатуры типа (CRF, ABC и т. Д.), А также другие типы заглавных слов (FOOD, HOUSE), и я должен их классифицировать.Различать аббревиатуру и просто заглавные слова?
Я не знаю с чего начать, можете ли вы указать мне на некоторые алгоритмы? Стохастические подходы, которые могут помочь мне решить проблему?
Я согласен с тем, что идея использования позиционного маркера помогла бы, если бы у меня были только сокращения и существительные, алфавит (гепатит А, В или С). Достаточно ли было бы пометки для различения этих случаев? –