Нечто подобное в Ruby, будет работать ...
require 'rubygems'
require 'nokogiri'
require 'open-uri'
html = Nokogiri::HTML(open('http://stackoverflow.com/questions/2441954/how-to-find-out-the-exact-rss-xml-path-of-a-website'))
puts html.css('link[type="application/atom+xml"]').first.attr('href')
# => "/feeds/question/2441954"
Обратите внимание, что это абсолютный URL путь, который является законным, так что вы должны были бы предварять данные хоста.
Кроме того, «application/atom + xml» также может быть «application/rss + xml» или «application/rdf + xml», а несколько ссылок можно найти на странице, поэтому вам нужно будет решить, как обрабатывать кратные. Согласно документам автообнаружения, первый из них должен быть предпочтительным, но из опыта, который я видел в противном случае. Кроме того, согласно документам, ссылки не должны быть альтернативными типами данных (RSS и ATOM, указывающими на один и тот же контент), но должны быть разными, но, опять же, я видел, что это происходит.
Для получения дополнительной информации о епархии автораспознавания ссылки: HTTP : //www.rssboard.org/rss-autodiscovery и http://philringnalda.com/rfc/draft-ietf-atompub-autodiscovery-01.html. –