Мы знаем, что сущности имеют разные проявления, например, «Барак Обама» может быть представлен как «Обама», «Президент» и «Барак Хусейн Обама».
Есть ли какой-нибудь алгоритм, который может определить, относятся ли эти три к одному и тому же сущности «Барак Обама»?Каков правильный алгоритм машинного обучения для этой задачи?
Спасибо!
EDIT 1:
я предоставлю более подробную информацию о моем случае. То, что я хочу сделать, - это подключить разные имена имен в Twitter.
Если я пришлю твит, содержащий «Барак Обаму», через некоторое время я отправлю еще один твит, содержащий «Президент», но без «Барака Обамы», тогда моя система должна быть в состоянии объединить две твиты вместе, потому что когда я говорю о «Бараке Обаме» и «Президенте» в двух твитах, я, очевидно, имею в виду одно и то же лицо.
Я думаю, что определение семантической эквивалентности здесь является легкой частью. Все становится интересным, когда речь идет о распознавании в разных средах (естественный язык, аудио, изображения, видео). Можете ли вы предоставить более подробное описание контекста? –
@JensPiegsa Спасибо за ваш ответ, плз см. Мой EDIT 1. – ChandlerQ
@JensPiegsa Мне нужно распознать сущности только в тексте на естественном языке, не могли бы вы представить некоторые сведения о том, как судить, эквивалентны ли два эквивалента? – ChandlerQ