Предположим, что это предложение: «Автомобиль не запускается в холодную погоду и должен менять лезвия ветрового стекла». Мне интересно узнать, какая часть автомобиля затронута, и в чем причина этого. Из приведенного выше предложения мы не можем сделать вывод, что лезвия ветрового стекла не начинаются. Кроме того, одно предложение может содержать несколько частей автомобиля. Как решить эту проблему?Как сделать семантический анализ из тега POS?
ответ
Я нашел решение, выше проблемы можно легко решить с помощью зависимостей Стэнфорда, поэтому мы можем использовать для этого стенографию Stanford coreNLP.
Вы собираетесь сосредоточиться только на одной теме (например, на автомобилях)?
Если да, то для очень грубой отправной точки, вы могли бы иметь словарь части автомобиля и несколько высокочастотного п-грамма, такие как «нужно изменить», «ремонт, необходимый» и т.д.
POS части автомобиля всегда будет существительным. N-граммы, которые означают какое-то необходимое действие, будут иметь глагол как его значение POS.
Когда вы обнаруживаете один из n-граммов, который означает проблему или запрашивает действие, вы можете запросить список автозапчастей, чтобы увидеть, какие из них являются ответственными или затронуты.
Помните, что я думаю, что вы можете извлечь выгоду из синтаксического дерева больше, чем просто POS. Дерево позволит вам отделить два предложения от вашего предложения: «автомобиль не запускается в холодную погоду» и «нужно менять лопасти ветрового стекла» и в какой-то мере отделить другие части автомобиля, которые могут быть частью проблемы (если вы у меня много) от тех, которые просто упоминаются ниже в тексте.
Если система предназначена для использования в нескольких доменах, возможно, вам придется углубиться в синтаксический анализ. Возможно, Именованное Распознавание Сущности, но это, как правило, для вещей с надлежащими существительными.
- 1. Семантический анализ Roslyn
- 2. Семантический анализ твитов
- 3. Семантический анализ в компиляторах
- 4. Вероятностный латентный семантический анализ
- 5. Eclipse PDT - семантический анализ
- 6. Семантический анализ в C#
- 7. Явный семантический анализ
- 8. Семантический анализ текста
- 9. Как сделать скрытый семантический анализ на очень большом наборе данных
- 10. nltk семантический анализ с координацией
- 11. Семантический анализ с использованием Solr
- 12. Латентных семантический анализ (LSA) Учебник
- 13. Семантический анализ для языка C
- 14. Как сделать POS масштабируемым?
- 15. c компилятор typecheck алгоритм и семантический анализ
- 16. Скрытый семантический анализ в поиске тем
- 17. URL семантический анализ с использованием R
- 18. Латентный семантический анализ в Python несовпадения
- 19. Таблица символов и семантический анализ для компилятора
- 20. Как сделать семантический зум без списка
- 21. LSA - Скрытый семантический анализ - как закодировать его в PHP?
- 22. Вычисление unskinned pos из skinned pos
- 23. Как сделать заказ из тега GitHub?
- 24. Как сделать POS n-граммы более эффективным?
- 25. Python: Как подсчитать pos-теги из предложения?
- 26. Преобразование слов в латентный семантический анализ (LSA) Векторы
- 27. Как связать глагол в NLTK с помощью тега POS?
- 28. Обработка текста, извлечение фактов, семантический анализ с использованием .Net
- 29. POS гистограмма со Стэнфордом POS Tagger
- 30. Как разбирать xml из определенного тега
Вы заинтересованы в «текстовом вступлении». посмотрите здесь: http://www.google.com/cse?cx=011664571474657673452%3A4w9swzkcxiy&cof=FORID%3A0&q=textual+entailment#gsc.tab=0&gsc.q=textual%20entailment&gsc.page=1 – Pierre
расскажите нам о ваши данные, объем вашей системы и то, что было опробовано – Pierre