4

Согласно моему пониманию, дистанционное наблюдение - это процесс определения понятия, которое пытаются передать отдельные слова прохода, обычно предложения.Что такое дистанционное наблюдение?

Например, база данных содержат структурированные отношения concerns(NLP, this sentence).

Нашей системы дистанционного контроля будет принимать в качестве входных данных предложения: "This is a sentence about NLP."

Основываясь на этом предложении было бы распознавать объекты, так как в качестве предварительной обработки шаг был бы передан через распознаватель именного объекта, NLP & this sentence.

Поскольку в нашей базе данных есть это, что NLP и this sentence связаны узами concern(s) было бы определить входное предложение как выражение отношения Concerns(NLP, this sentence).

Мои вопросы два раза:

1) Какая польза от этого? Неужели позже наша система увидит предложение в «дикой природе», такое как That sentence is about OPP, и поймет, что перед ним видят нечто подобное этому и таким образом реализуют новые отношения, такие как concerns(OPP, that sentence)., основанные только на словах/отдельных жетонах?

2) Учитывает ли это фактические слова предложения? Глагол «есть» и наречие «о», например, реализуя (через WordNet или какую-то другую систему гипонимии), что это как-то похоже на концепцию более высокого порядка «проблемы»?

У кого-нибудь есть код, используемый для создания системы удаленного наблюдения, на которую я мог бы обратить внимание, то есть система, которая перекрестно ссылается на КБ, такую ​​как Freebase и corpus, такие как NYTimes, и создает удаленную базу данных наблюдения ? Я думаю, что это проделало бы долгий путь в разъяснении моей концепции дистанционного наблюдения.

ответ

4

RE 1) Да, это точно. В конце концов, нам нужен классификатор, который принимает в качестве входного текста, а пара объектов упоминает в тексте и сообщает нам, какое отношение имеет отношение между этими объектами в этом предложении. Дистанционное наблюдение - это способ издеваться над этими данными обучения, используя «дистанционный контроль» из известной базы знаний. Но конечная цель такая же, как и большинство задач машинного обучения: обобщить на новые предложения.

RE 2) Конечно! Дистанционное наблюдение применяется только к тому, как генерируются данные обучения [1]. После того, как вы взяли на себя дальнейший контроль, то, что вы оставили, представляет собой совокупность пар (предложение, отношение_for_sentence), а затем вы извлекаете все обычные функции NLP в предложении.

[1] В первом приближении - существуют модели с дистанционным контролем (например, MultiR и MIML-RE), которые непосредственно не генерируют данные поддельной подготовки, но включают в себя наблюдение косвенно в самой учебной процедуре. Но даже в этом есть фактор в модели с скрытой переменной, который сводится к классификации по каждому предложению, и именно так, что выходная переменная является скрытой, а не наивно «наблюдаемой», как при наблюдении в ванили.

0

В соответствии с моим пониманием сейчас реальная ценность дистанционного наблюдения заключается в том, что мы можем использовать его для аннотации большого корпуса без необходимости вручную рассматривать каждое предложение, поскольку это очень дорого с точки зрения человеческих часов, поэтому в конце некоторые из признанных отношений в предложениях будут ложными, но это будет, надеюсь, «довольно хорошо» ... что полезно - в некоторых приложениях, таких как ... академики, конкурирующие с афористами, чтобы попытаться получить незначительно лучшие оценки на этом глупом задача и ...другие вещи, такие как ... (примеры приветствуются)

Смежные вопросы