Я пытаюсь вернуть все URL-адреса, предоставленные на веб-сайтах, например, карту сайта Argos. После того, как у меня есть эти URL-адреса, мне нужно повторить этот процесс, чтобы возвращать любые URL-адреса, которые могут содержать результирующие URL-адреса. Например:Возврат карты сайта URL-адреса
http://www.argos.co.uk/sitemap.xml возвращается:
http://www.argos. co.uk/product.xml
http://www.argos. co.uk/product2.xml
http://www.argos. co.uk/catalogue.xml
http://www.argos. co.uk/buyers_guides.xml
http://www.argos. co.uk/features_and_articles.xml
http://www.argos. co.uk/static_pages.xml
http://www.argos. co.uk/store_pages.xml
http://www.argos.co.uk/product.xml затем содержит свои собственные ссылки, которые я требую (этот процесс повторяется до тех пор, страница не будет достигнуто, не содержащий больше URL, XML, доступные)
До сих пор:
var urls = require('sitemap-urls'); //package to return xml links from sitemap
var cheerio = require('cheerio');
var request = require('request')
// Returns all xml urls located within page source
request('http://www.argos.co.uk/sitemap.xml', function (error, response, html) {
var sitemap = html;
var results = urls.extractUrls(sitemap);
// If results returned, loop to make sitemap equal each url until array end
if(results) {
for(i = 0; i < results.length; i++) {
sitemap = results[i]
console.log(sitemap)
// Need to repeat url return process for each url returned
}
}
});
Может быть, простое решение, которое я пропускаю, любая помощь будет очень признательна, спасибо.
Спасибо, но это должно быть в JavaScript. Извините за то, что вы не поняли этого – Jordan