Есть ли что-то [направленное?] Понятие/реализация расстояния между категориями/страницами Википедии?Wiki-distance: расстояние между темами и категориями Wiki?
Для примера рассмотрим: A) "Сент-Луис университет" Б) "Университет"
Ясно "А" тип "B". Как вы можете извлечь это из Wiki? Если извлечь все категории подключения к A, вы бы увидели, что он дает
Category:1818 establishments in Missouri Territory
Category:Articles containing Latin-language text
Category:Association of Catholic Colleges and Universities
Category:Commons category with local link same as on Wikidata
Category:Coordinates on Wikidata
Category:Educational institutions established in 1818
Category:Instances of Infobox university using image size
Category:Jesuit universities and colleges in the United States
Category:Roman Catholic Archdiocese of St. Louis
Category:Roman Catholic universities and colleges in Missouri
и не содержит ничего, что бы напрямую подключиться к B (https://en.wikipedia.org/wiki/University). Но, по существу, если вы посмотрите дальше, вы сможете найти путь с несколькими переходами между A и B, возможно, несколько переходов. Каковы популярные способы достижения этого?
вы можете рассмотреть глядя в мой проект по экстрагенту иерархии категорий Википедии - HTTPS://github.com/wasiahmad/Mining-Wikipedia/tree/master/WikiNomy –
@WasiAhmad Как ваш проект отличается от доступа к вики-информации через MediaWiki api? – Daniel
В моем проекте не используется API, он извлекает иерархию категорий непосредственно из дампа Wiki. Мне нужна вся иерархия категорий Wiki для одной из моих исследовательских работ, поэтому я разработал этот проект. –