[Пожалуйста ссылочка Пита Киркхемы, он первый пришел со ссылкой на SUMO, который вполне может ответить на вопрос, заданный Алекс, Ор]
(я просто служить дополнение информации здесь, я началось в поле комментариев, но вскоре закончилось пространство и макеты возможностей ...)
Alex: Большая часть SUMO - это наука или техника? Он не содержит ежедневные слова, такие как еда, люди, автомобили, рабочие места и т. Д.?
Pete K: SUMO - это верхняя онтология. Онтологии среднего уровня (где вы найдете понятия между «вещью» и «говяжьим буррито»), перечисленные на странице, не включают в себя продукты питания, но отражают виды организаций, которые финансируют проект. Для людей существует онтология среднего уровня. Существует также один для отраслей промышленности (и, следовательно, для рабочих мест), включая поставщиков продуктов питания, но не упоминается о буррито, если вы grep его.
Мои два цента
100% от WordNet (3,0, т.е. последним, а также более ранние версии) является сопоставляются сумо, и что может быть просто то, что Алекс нужно. Онтологии среднего уровня, связанные с SUMO (или, скорее, с MILO), эффективно работают в определенных областях и в настоящее время не включают Foodstuff, но поскольку WordNet делает (включая все - многие, многие из этих повседневных вещей), вы делаете не нужно использовать какую-либо формальную онтологию "под" SUMO ", но вместо этого использовать сопоставление WordNet Сумо (возможно, помимо WordNet, которое, опять же, не является онтологией, но с ее неформальной и свободной иерархией) также может помочь.
некоторые трудности могут возникнуть, однако, из двух области (а затем некоторые ;-)):
- «уровень» сумо онтология не может быть уровень нужно иметь в виду для вашего конкретного применения. К примеру в то время как «буррито» приносит «Food», на верхнем уровне в SUMO «Chicken» приносит хорошо «Chicken», который только через длинную цепочку находит «Animal» (в частности: куриное > Poultry-> птица,> Warm_Blooded_Vertebrae-> Vertebrae-> Animal).
- Покрытие и метаданные Wordnet впечатляют, но в отношении концепций среднего уровня может быть немного непоследовательным. Например, «наш» гиперним «Burrito» соответствует «Блюдо», которое предоставляет ему около 140 блюд для еды, в которые входят дженерики, такие как «Суп» или «Кастрюля», а также «Куриный Маренго» (но, не говоря о «Chicken Cacciatore»)
Моя точка, в результате чего эти вопросы, не критиковать WordNet или SUMO и связанных онтологий, а для иллюстрации просто некоторые из проблем, связанных с построением онтологии, особенно на среднем уровне.
Независимо от некоторых возможных недостатков и lackings раствора на основе SUMO и WordNet, прагматическое использование этих структур вполне может «приспосабливать счет» (85% времени) hypernym дерево
Большая часть SUMO - это наука или техника? Он не содержит ежедневные слова, такие как еда, люди, автомобили, рабочие места и т. Д.? – TIMEX
SUMO - это верхняя онтология. Онтологии среднего уровня (где вы найдете понятия между «вещью» и «говяжьим буррито»), перечисленные на странице, не включают в себя продукты питания, но отражают виды организаций, которые финансируют проект. Для людей существует онтология среднего уровня. Существует также один для отраслей промышленности (и, следовательно, для рабочих мест), включая поставщиков продуктов питания, но не упоминается о буррито, если вы его усваиваете. –
Спасибо, Пит. f – TIMEX